AI编程是生成式AI崛起以来最热门的赛道之一,不仅海内外大厂均有布局,而且已经诞生了数家融资额过亿,估值过10亿美元的头部创业公司。
无论对于程序员还是企业客户,AI编程的本质价值是降本增效,而且它带来的效果是直接的,目前已有44%的程序员使用过AI编程软件。
对于大多数科技公司,技术团队是核心团队之一,他们构建了公司的核心技术。同时,维持技术团队的规模也是公司开支的主要部分,根据Gartner的数据,科技公司每年在软件工程上的支出超过1万亿美元。
但是在公司层面,大多数公司对于目前的软件并不满意。一方面,现代软件功能丰富,同时结构也很复杂,维持软硬件堆栈需要多个不同职能的技术团队配合,这会产生很高的人力成本。
另一方面,软件脆弱而维护成本高昂,开发团队因功能请求、错误修复、安全补丁、集成请求、迁移和升级的长期积压而面临困难。同时还需要运维和测试团队的配合,而运维和测试团队的特点是,不需要太多创造性,但是需要“堆人”。
对于程序员,在他们的实际工作中,往往因为各种冗长的会议和复杂的需求沟通,导致实际用来编程的时间较少。而在实际的编程工作中,还有很多不需要怎么思考的“杂活”。这压缩了他们能够认真思考和高质量编程的时间精力,进而导致他们效率偏低,产出偏少,成就感低。
AI编程软件成为AI时代最热门的应用细分赛道之一并不是偶然,对于企业来说,他们希望AI帮助技术团队提高效率,并且做一些需要“智能”的重复性工作,缩减外围团队成本。对于程序员来说,AI编程助手能够帮助他们节省时间,提高效率,并且把更多时间放在“有效编程”上,让更多技术人员成为“10倍程序员”。
最近的StackOverflow(程序设计领域的大型社区) 调查显示,44%的程序员表示目前正在使用AI编程工具作为开发流程的一部分,26%的人计划很快使用。Gartner估计,超过一半的组织目前正在试点或已经部署了AI编程助手,到2028年,75%的程序员将以某种形式使用AI编程工具。
AI编程赛道独角兽井喷
编程能力已经是各个大模型厂商在打造基础模型时的一个重要努力方向,因为这和数学能力一样,能从侧面显示出模型的逻辑推理能力。自GPT-4发布以来,每一个模型在发布时,都要重点介绍自己的编程能力。而评判模型编程能力的Benchmark也在不断迭代,从最初的HumanEval到现在更接近真实,更能评估模型解决实际编程问题能力的SWE-bench。
在人工智能时代,人们打造AI编程软件的思路是以模型能力为基底,从实际的需求和场景出发,去打造产品能力。在这个过程中,模型和专有数据固然能在能力上保证产品的性能,对于场景和需求的理解,更决定了产品与用户(客户)的契合度。
大厂积极布局
AI编程软件最早推出的形式是编程助手,这也是目前最主流的方式,它的代表产品是GitHub Copilot。
GitHub Copilot既针对个人开发者用户,又针对企业客户,它具有代码补全,代码注释,函数生成,代码审查等一系列对于程序员来说非常实用的功能。而且GitHub Copilot背靠微软和OpenAI,在技术上较有保证。
GitHub Copilot也是在这个赛道上商业化领先的产品,截至2024年2月,它已经有130万的付费用户和50000个企业客户。
微软的竞争对手们也纷纷推出了对标的产品,AWS有CodeWhisperer,Meta有Code Llama,谷歌则将产品更新成Gemini Code Assist,这些产品都基于先进的AI模型搭建。
多家创业公司获得大额融资
不过,大厂推出这些产品主要是为了搭建生态,保证自己不落后,产品和技术创新的中心还是看创业公司。海外在这个赛道耕耘的代表性创业公司有Replit、Codium、cognition-labs、Augment等,它们都做了不同程度的产品创新。
例如Replit,Codium都有IDE插件产品,集成度更高,更贴近个人程序员的使用习惯。Codium还推出Coding-Agent,具有本地代码索引和检索增强生成功能,可以根据需求自动化生成代码,进一步提升编程的自动化水平。
而cognition-labs更是推出了AI程序员Devin,可以把它看成专门经过编程优化的自动Agent,它能够独立工作,而不仅是作为程序员的辅助工具。这种产品形式对于企业客户更有吸引力。
在商业模式上,不少公司主要还是面向程序员群体,AI编程软件既能降低编程的门槛,帮助初级程序员拓展边界,又能让资深程序员提高效率,少做“脏活”,更大程度发挥创造力,所以会有较强的付费意愿。
而Augment则是面向企业,它根据大企业的需求加强了AI编程软件的推理运行速度,以及安全性和可靠性。基于AI编程软件商业化的本质需求:降低成本,提高效率,释放生产力,未来的公司在商业化时会越来越将企业客户作为重点。
在融资情况上,AI编程赛道的公司们都获得了AI应用领域相对大额的融资,例如Replit获得了a16z领投的9740万美元融资,估值11.6亿美元;Codium获得6500万美元融资,估值5亿美元;cognition-labs此前获得Founder's Fund领投的2100万美元融资后,又将以20亿美元估值获得Founder's Fund投资的新一笔融资;Augment则获得2.52亿美元融资,估值9.77亿美元。可以说,AI编程赛道是AI应用领域独角兽最集中的方向之一。
在创始人背景上,AI编程赛道的公司大多由具有雄厚编程技术背景的顶尖人才创立,无论他们是来自产业界还是学术界。例如Replit的创始人Amjad Masa曾在雅虎和Facebook有多年的编程经验,而Augment的创始人Igor Ostrovsky则来自微软;cognition-labs的创始团队的成员获得了10个IOI(国际信息学奥林匹克竞赛)金牌,而且大多为华人。
中国有自主框架和技术的AI编程产品
在中国市场,AI编程也是AI应用相当火热的领域,无论是大厂还是头部创业公司都在这个领域推出了自己的产品。互联网大厂中,百度有Comate,阿里有通义灵码,商汤有代码小浣熊Raccoon,华为有盘古Coder。他们都基于自有的大模型搭建,多是以AI编程助手为产品形式,在功能上与GitHub Copilot近似,并且在多程序语言支持,IDE兼容和中文编程上表现都较好。
与海外市场相比,国内专注于AI编程的创业公司目前还相对较少,但也有头部创业公司推出能力较强的AI助手产品,典型的例子是智谱AI的CodeGeeX和非十科技的Fitten Code,这两家创业公司的创业团队都来自清华。
而且这两个产品都基于国产的框架开发,例如CodeGeeX由清华大学的知识工程实验室团队与智谱AI合作开发,采用了华为MindSpore框架,而Fitten Code则基于自有的Jittor深度学习框架打造。
在中国目前的AI创业环境下,使用国产框架开发,在国产AI基础设施上运行,使这些AI编程产品具有较好的自主性和“安全性”。而无论是依托中国庞大的国内市场发展,还是出海直面国际竞争,中国的创业公司和AI编程产品都具有不错的潜力和发展空间。
AI编程赛道,何时开始赚钱?
尽管AI编程有不少大大小小的玩家,有获得了大额融资的创业公司,但它仍然处于发展的早期阶段,面临一系列问题。
第一个问题是成本和效益的平衡,因为AI模型推理成本的高企,大多数AI编程企业都处于亏损状态,甚至背靠微软的GitHub Copilot目前每个用户每个月也要亏损约20至80美元,也就是它还没有解决单位经济学问题。而要解决这个问题,将运营成本降下来,需要AI算力和AI云服务公司的共同努力,在这个方向上同样有不少公司,例如Foundry(AI云服务)和d-Matrix(推理芯片)就在这个方面深耕。
第二个问题是安全问题,也就是AI编程工具生成的代码仍然有质量低,错误偏多的问题,这会放大软件项目中现有的错误和漏洞。这个问题,本质上还是因为AI模型本身就会产生“幻觉”,并且生成内容的精确性还不够高。未来要解决这个问题,一方面需要升级AI编程模型的基础能力,减少“幻觉”,另一方面也需要在工程方面针对性地打好补丁。