围绕ToB的云计算和大模型服务竞争正在愈发激烈。
2024年下半年,字节在AI上的饱和式投入在火山引擎上彰显无疑——5月15日,豆包将主力模型价格降至 0.0008 元/千 Tokens 。5月21日,最早提出MaaS(模型即服务)的阿里云紧追不舍,将通义千问主力模型价格从降至0.0005元/千tokens。几小时后,百度智能云宣布文心大模型两大主力模型全面免费。
巨头下场厮杀,MaaS战事进入白热化,有提供MaaS服务的公司甚至开始逐步改换其他赛道。
在激烈的态势之中,各家都在尝试做出一些差异化,或找到自己的生存方式。火山引擎也是其中之一。
在2024年上半年,火山引擎给外界最明显的感受之一是,他们在尝试用“价格优势”渗透市场。半年前的5月15日,字节也以0.0008 元/千 Tokens 的价格,进入国内大模型价格战的肉搏中。在半年后,这一特质几乎成为了火山引擎的“常规操作”。火山引擎总裁谭待向虎嗅表示“只要大家follow我们的价格就可以了。不同于其他可能亏损的友商,我们能够压低成本来保持可持续的商业模式。”
但谭待认为,火山引擎的崛起,绝不仅是依靠“价格战”。
12月16日,谭待和虎嗅进行了一次深入交流,我们希望了解这半年多火山引擎的变化,以及谭待对于行业的一些新思考。
以下为虎嗅12月16日与谭待交流实录:
增长和团队
虎嗅:你用哪些维度,去评估火山引擎的发展情况?
谭待:客户和开发者的使用量。这里面有一个关键维度是,我要看到底有多少客户是在深度使用的,迈入了真正应用AI的门槛,我们内部有个“双10”说法——日均Token达到10亿,有10个Agent(智能体)使用场景。
虎嗅:上次交流是五月了,五月至今你们的客户量、开发者使用量增长情况怎样?
谭待:都是非常乐观的增长态势。而且我们通过比较好的商业化手段,让成本和收入保持比较好的平衡。
虎嗅:具体增长到多少量?
谭待:我们近期会公布具体增长情况。
虎嗅:你如何解读增长背后的原因?外界普遍认为你们依靠价格优势取胜。
谭待:价格只是常规操作。我觉得是这样子,只要大家follow我们的价格就可以了。我们的视频理解模型已经降至0.003元每千tokens。
但更关键的是产品,在模型能力这里我们形成了一个循环——通过提高模型能力、压低成本来扩大用户使用规模,从而带回更多用户需求,再针对性地进行产品和解决方案的研发,最终带来模型能力的提升。
以及我们也会有一些团队策略的调整,比如我们建立了一支AI落地服务的团队。
这个团队里面有算法专家,有做PE的专家,也有行业的专家,也有技术的服务客户。对于这些重要的客户,或者是在关键产品上有挑战的客户,服务团队会进场和他们一起来优化。
虎嗅:这个团队是什么时候建立的?
谭待:最早火山引擎在做第一个产品——推荐服务时,就有OPPO、vivo等手机客户反馈,他们想要的不是一个平台,而是通过平台加算法服务,把商业变现效果做上去并为此付费。当时我们就建了一个算法服务团队来做这件事情。而我们认为AI更需要这样的服务团队,而且这个事情更难——没有统一的标准,有时候客户会把这个事情想得太简单,有时又想得太难,而服务团队能够帮助客户更快地找到PMF,我们就直接以此为基础去扩建了这个团队,其实效果还挺好。
虎嗅:具体是怎么帮客户找到PMF的?难点在哪?
谭待:首先是诊断加咨询,了解客户需求和要解决的场景问题。我们会优先做业务价值高,实现难度又低的。
因为模型进展很快,其实有些问题当前解决不了的,可能一个月后就能解决。这里面我们会遇到一些情况,比如客户数据可能特别敏感的,无法提供给我们,就需要我们按照对场景的理解,补充对应的合成数据来优化模型的效果。
我觉得在这个阶段的话,因为你的产品和模型在不断地变,用户的需求也不是特别清晰。这个时候就需要有一个比较立体的综合性打法。在这个过程中,我们积累了非常多的案例,上线了100个best practice的案例模版库。当针对客户不同需求的流程和做法都固定下来,可能大家都知道该怎么干了,那你的服务在里面就可以弱一些。
虎嗅:这些流程模式现在形成一套成熟的打法了吗?
谭待:我觉得把整个大模型的应用重要场景都解锁完了,这个事就实现了。它是一个过程,当然这半年我们其实找到了很多好的方案。但是很快就会看到有新的更难的问题,但我觉得这个更有价值,因为不是过去问题的重复。比如说我做了A类问题,然后诞生了A plus问题,那个A plus它有更高价值难度也更大。这时我们就可以复用A问题的解决方案。
虎嗅:火山引擎内部是怎么去做团队协同,让效率更高的?
谭待:第一,火山引擎算法负责人吴迪、基础架构负责人赵鹏伟等核心团队,本身就服务了抖音和头条很长时间,他知道大规模的系统是怎么构建的。
第二,我们内部也有很多新的探索,有更好的视野,他能看得清楚的大家都在做什么,以及未来会发生什么。
最后是,转成对应的技术和产品规划,以及用什么样的组织去承接好这些技术和产品的落地和发布。
这个过程中,还是需要不断去优化的。也不能说我们现在做的特别好,但是至少我们在第一步和第二步有些天然的优势,我们本身就有那么多的客户,以及我们有抖音、头条、豆包,本身就有很多前沿场景。
虎嗅:今年咱们团队扩招人数多吗?
谭待:扩招不算太多。因为我们原来人就很多,我们一开始的目标,并不是说我们做十个亿的时候,建十个亿的团队。我想的是最终是要做到多大,要服务多少人,为了这个目的来提前做好储备。所以提前做好储备之后,后面不用太扩了。这样我觉得反而效果可能是更好的。这是一个先有鸡还是先有蛋的问题。
但是我们的资源投入的分配上,是有很大的变化的。更多向大模型方向倾斜,传统的就会少一些。
虎嗅:25年火山引擎的打法会更侧重哪些方面?
谭待:我觉得现在其实各行各业用得都不是特别深。比如,有很多游戏公司它的NPC用了我们,但是NPC只是游戏中的一个环节,还有其他环节可以继续渗透,AI去做好游戏的辅助,甚至能够去创造地图。我们后面会有AI 3D模型的发布,可以用它去做好开放世界。
游戏这个场景,可能我们就解锁1%,还有很多场景没有解锁。我们希望的是今年这个客户解锁了5%的场景,明年解锁50%的场景。
激烈的大厂竞争,差异化在哪
虎嗅:最近半年客户的需求跟之前相比有什么变化?
谭待:用得越来越深了。第一、从训练逐渐向推理走。第二、从用开源自建,到直接使用豆包MaaS服务,这是一个很明显趋势。第三,从简单的场景往更难的场景走,比如从简单的chatbot到需要逻辑推理能力的生产力场景。
我们看到还有一些需要multi model或者multi agent来联合来解决的复杂场景,明年对于复杂智能体场景,是一个关键时间点。
虎嗅:面对这些需求变化,2025年的时候,云厂商的竞争格局会有什么变化?
谭待:25年肯定比24年竞争更激烈。ToB是细水长流,不像toC可能一年格局立刻发生巨大变化,ToB则可能要七八年。但是你头三年做的事情基本就决定了8年后的格局,它是这样的,只不过它的结果的呈现会更慢。
虎嗅:目前云厂的差异点和壁垒在哪?
谭待:核心还是模型能力。
虎嗅:您认为2025年的话,竞争的差异点会发生变化吗?
谭待:差异点还是这些。但是做的好坏的差别会更大,就是好的会更好,差的会更差。
有的公司不做基础模型了,就做个小模型,在上面做很多事情,我觉得这样从长期看不现实。他就回到以前的那个时代,就是有多少人工就有多少智能,而且上限是很低的。
虎嗅:您之前提到的差异点在于价格,现在对于价格有什么新的思考吗?
谭待:保持这个价格竞争力就好了,保持住的核心不是为了竞争,是说这样的价格是有助于企业和开发者基于大模型做好创新。其实我们不太关注竞争这个事情,关注的是能不能让业界都能用得起好的模型,快速地创新就会有好的想法涌不断现出来,这个是最重要的事情。我觉得现在我们已经做到了。
后面更关键是在这样的性价比的情况下,不断把你的模型能力提升,这样就一定会涌现出新的商业模式。最开始模型处理都是按token来收费对吧?但是你处理一个难的问题和一个简单的问题,同一个token的价值是完全不一样的。
另外,ToB跟ToC不同,不存在先烧钱获取市场,后续再靠其他收费的商业模式。我们做了大量的成本优化,来维持可持续的商业模式。另外一些厂商成本没有优化下来,如果按照这样的价格去对外服务的话,它是亏损的,是不可持续的。
虎嗅:这半年多咱们内部做了哪些事情去保持这种可持续的平衡?
谭待:本身模型结构上我们做了非常多的优化,seed团队最近有论文在讲这个事情。工程上,把推理波峰和波谷不同负载的混合调度可能会省三到四倍。在推理架构上,将云原生和AI原生结合在一起,去打造新的体系架构。比如做了PD分离。
虎嗅:现在国内外一些大厂的算力储备已经到了十万卡级别,咱们在这方面的储备是怎么样的?
谭待:我只能说我们MaaS的资源肯定是非常充足的。
虎嗅:三月份去硅谷有感受到国内外云及MaaS的不同吗?
谭待:海外有一个很好的软件和SaaS的生态。所以它在整个AI的企业应用上,其实会更快一些。SaaS厂商在里面起到了一个很好的桥接的工作。就很多能力是SaaS先应用,之后自然企业就用上了。
国内其实没有一个很强的SaaS和软件生态,所以我们就得直接跟企业对接,来解决这个问题。
但是其实从移动互联网开始,国内在应用创新的热情和速度上,是很快的。比如,国内移动支付的跨越式发展。国内的AI SaaS,虽然没有基础,但也意味着没有负担。所以也许这就像移动互联网和移动支付一样,能找到一条弯道超车的路。