tiknovel.com tiknovel

AI

当前位置:首页 > 技术圈 > AI

阿里又在AI上大出血了

阿里又在AI上大出血了

阿里在AI上下足了血本。

近日,中国AI大模型初创公司MiniMax正在进行新一轮大规模融资,阿里是其中的核心领投方,融资金额尚未披露。MiniMax成立于2021年,同时拥有文本、语音、视觉三模态融合的通用大模型引擎能力,并打通了产品全链路。

这已是阿里在2024年的第二笔AI大模型项目领投投资。2月,阿里给中国AI初创公司“月之暗面”(Moonshot AI)投资了8亿美元。红杉中国、小红书、美团等均参与了本轮融资。

此前,阿里还投资了百川智能、零一万物等国产大模型公司。

阿里频密投资AI大模型产业,且每笔交易动辄数亿元,结合其在2023年底提出的“AI驱动、公共云优先”战略,不难看出其渗透AI大模型产业并追求反哺的野心。

但AI大模型毕竟是新兴产业,去年才真正进入大众文化圈层,产业发展前景尚未被摸清,阿里就迫切入局,除了为迎合市场趋势,还因其核心业务与AI大模型紧密相关。

想靠MiniMax重振云业务

MiniMax的开发目标与ChatGPT的AI解决方案相似。

2023年3月,MiniMax推出基于端到端的自研多模态大语言模型“MiniMax开放平台”,拥有逻辑推理、文本续写、文案生成、音频交互等功能,能够为使用者提供应用程序编程接口能力和专区方案,以最大限度降低使用复杂性。

MiniMax还基于MoE(“专家混合”,一种深度学习技术)发布了另一个大模型。MoE已在一篇由谷歌、MIT等机构联合发表的论文中,被证实能够大幅提升语言模型的性能。

技术的突破,让MiniMax成为国产明星。2023年6月,MiniMax已完成2.5亿美元融资,公司估值飙升至12亿美元。

在MiniMax之前,阿里就“试水”过AI大模型产业。2023年4月,阿里揭晓超大规模的语言模型“通义千问”,阿里前CEO张勇表示,包含天猫、钉钉、淘宝、高德地图在内的所有阿里产品未来都会接入此大模型。“通义千问”拥有与人类进行多轮交互、续写小说与邮件等功能。目前,其在全球最大模型社区Hugging Face的开源大模型排行榜中名列前矛。

这场试水对阿里的云业务有提振作用。据财报显示,2024财年第三季度,阿里云在该季度营收增长3%至280.66亿元人民币,经调整EBITA利润增长86%至23.64亿元人民币,创财年新高。

阿里还凭借AI大模型拿到了更多政企客户资源,比如参与京能国际北京人工智能公共算力平台、江苏医保云平台(三期)等等项目。

尝到甜头的阿里,坚定了发力AI大模型的决心,并希望依赖新成员MiniMax的助力,重振其核心业务“云服务”。据悉,阿里正在寻找刺激从云计算到物流的独立业务线的方法,将AI大模型整合到一个横跨娱乐产业的业务中。

分一杯AI大模型的羹

阿里将注意力转向AI大模型,有多方原因。

2022年末,ChatGPT的问世,宣告着AI大模型产业强势入场、成为全球话题度最高的科技新秀。

当国内媒体还在讨论这个新奇玩意时,海外已有投资方赚得盆满钵满。

2019年起,微软前后共3次投资ChatGPT。而微软接入ChatGPT后的首份成绩单显示,2023年第一季度,营收同比增长7%至528.5亿美元、归母净利润同比增长9%至183亿美元,一改前几季度的下跌态势。财报指出,微软智能云业务已挑起大梁、营收占总收入的42%,旗下Azure OpenAI服务的客户数将较第二财季增长10倍。

如此强势表现,直接撩动了一众国内资本。

2023年3月,百度旗下知识增强大语言模型“文心一言”发布邀测。在短短一小时内,排队申请测试的企业超3万家;4月,搜狗创始人王小川官宣入局大模型产业,将和前搜狗COO茹立云联合创立人工智能公司——百川智能;5月,科大讯飞发布星火认知大模型,宣称对标ChatGPT;腾讯、字节跳动等互联网大厂也相继推出了AI大模型产品。

《2023中国新一代人工智能科技产业发展报告》显示,截至2023年10月,国内大模型总数已达238个,产品数量随即使市场膨胀。

通过试错,各路大模型发布会的强调重点也悄然转变为赋能产业、场景结合、行业垂直," 落地 " 成为了此次 AI 创业浪潮的最大目标。

比如,阅文集团的作家助手妙笔版定位为“行业首个网文大模型”,提供辅助创造、内容诊断、答疑解惑等功能;百度从训大模型、用大模型和做应用三个层次服务客户,探索政务、金融、交通等领域的大模型落地;华为云“5+N+X”的思路构建华为盘古大模型,形成了政务、金融、矿山、智能驾驶等行业解决方案,并放出了“不作诗只做事”的豪言。

截至2023年8月底,百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等8 家企业/机构的大模型,已首批正式上线开始面向公众提供服务。

对于阿里而言,在强调行业场景落地的背景之下,需要对AI业务进行重新梳理,聚焦在云计算和电商等领域。

2023年底,阿里云成立公共云业务事业部、政企事业部和海外业务事业部,提出“其他非核心资产要逐渐剥离”,整合资源以聚焦核心业务“电商+云”。在2024财年的前9个月,阿里已完成17亿美元的非核心资产出售。

阿里国际站率先开启AI技术的实践。2023年,其面向全球发布首个包含“生意助手”、OKKI AI两大服务的AI外贸工具,并在2024年提出“帮助新商家快速上手外贸生意”的AI极简出海计划。

有投资人认为,阿里其实是通过投资的方式,实现了项目方对算力集群需求和阿里云的长期绑定。因为阿里在投资这些大模型公司时,有一部分就是使用的算力支付。而大模型在运营过程中,非常依赖云服务,甚至大部分融资都用于向云厂商购买算力。

但阿里云的成绩与气势并不匹配。IDC发布的中国公有云报告显示,2022年下半年,阿里云的市场份额虽仍凭31.9%排名第一,但相比2021年同期的36.7%,缩减了4.8个百分点;2023年上半年,其市场份额继续缩减至29.9%——值得注意的是,这一时期的公有云市场集中度同比下降了3%。

阿里在此节点重金投资MiniMax,很可能是为抢回市场主导权,为构建云服务蓝图再加一注筹码。

烧钱的困局

跑得太快,砂石便扑面而来。国产AI大模型蓬勃发展的另一端,是一个个尚未解决的问题。

其中,烧钱是最大的问题。

据浙商证券研报估算,国内若想做出与ChatGPT同等性能的大模型,需要投入56亿元人民币的开发资金,以及每年1.7亿元人民币的电费——AI大模型是以“年”为训练期限的,比如从2018年开始训练的ChatGPT,到2022年仍处于亏损5.4亿美元的状态。

产品开发出来后,也需要钱去运行维护。据悉,AI大模型每跑一遍就要调动数个A100 GPU,后者每个价值1万美元(约合人民币7.2万元),即便是市面上最便宜的GPT-3.5,一天处理1000万条500字节的问题,每年也需要支出1095万美元(约合人民币7872万元)。

此外,美国限制高端芯片出口后,国内部分云服务供应商顺势提高了价格。据创投日报,这一价格涨幅最高去到60%。月之暗面创始人杨植麟曾在采访中表示,有一段时间机器价格每天都在变。

怎么提高AI大模型的效率,也是需要思考的问题。2022年中国信通院公布的数据显示,中国与美国的服务器存量不相上下,但对比公共云的算力输出率,中国仅28%,美国为60%、欧洲为50%。

这些难题,让国内投资者按下交易暂停键,态度转为观望。截至2023年 11月20日,这一年中国AI赛道在一级市场的总融资件数同比减少26%至530 起,总融资额估值同比下降38%至631亿元人民币。

相比之下,在海外市场,Google、亚马逊、微软等企业均在考虑自研芯片,以降低AI大模型的运行成本。这给了海外投资者更多信心,美国斯坦佛大学统计的数据显示,2020年,美国对AI领域的投资额是中国的2.7倍,2021年这一数据升至3.1倍。

海外AI大模型产业在资金扶持下也得以研发出更多精良产品,发展进入良性循环。就在国产大模型的产业化落地有条不紊地进行时,OpenAI再度进化拉开身位。

2023年11月,OpenAI再次取得突破性成就。北京时间11月7日凌晨,OpenAI在开发者大会上公布了最新成果GPT-4 Turbo,不仅更快、有更长的上下文、更好的控制,API的价格也下调至原来的1/3,降到了1000输入/美分。

同时OpenAI推出了GPTs,每一个GPT像是ChatGPT的一个为了特殊目的而做出的定制版本,用户可以用自然语言构建定制化GPT,然后上传到GPT Store。

来到今年2月,全球话题度极高的视频大模型Sora正式发布,国产大模型似乎再次被甩开了一个版本的代差。

包括阿里在内的所有国产AI而言,目前都面临着在未能解决资金和效率问题的时刻,再度落后版本代差,是安于现状地进行具体场景落地的应用性开发,或大举追加巨额投资去缩短版本差距,都将是一个困难的抉择。


评论排行榜