经历了半年的AI洗礼,或许很难找到比“应激反应”更恰当的词,来形容今天科技行业中每个人的状态——紧张、刺激、压力。
“应激反应”, 是指生物体在遭遇外部环境压力或威胁时,为了维持身体的稳态而产生的一系列反应。它是生物为了适应环境、确保生存所产生的一种自然反应。这种反应可以是短暂的,也可以是长期的。
7月26日,OpenAI官方推特宣布,安卓版ChatGPT已在美国、印度、孟加拉国和巴西提供下载,并计划在近期推广至更多国家。ChatGPT正在拓展渠道,获得更多的用户和更强的使用粘性,生成式AI的浪潮在持续推高。
7月初,上海的2023世界人工智能大会(WAIC)上,一位大模型创业公司的技术人员正在展厅里穿梭,她计划为公司寻找一个性价比高的国产芯片解决方案,用来做大模型训练。
“我们有1000张A100,但完全不够。”她告诉虎嗅。
A100是英伟达的一款高端GPU,也是ChatGPT生长的硬件基础。一些公开数据显示,在训练GPT系列模型的过程中,OpenAI所使用的英伟达GPU数量约2.5万个。由此,要做大模型,要先评估能拿到多少张A100的显卡,几乎成了这个行业的惯例。
哪里有GPU?哪里有便宜算力?这只是2023WAIC大会上众多问题的缩影。
过去半年里所有被“应激”到的人,几乎都渴望能够在这场“盛会”中找到更多关于AI的答案。
2023WAIC现场
一家芯片展商的技术人员告诉虎嗅,在WAIC大会的几天里,他们的“大模型”展台前,来了好些产品经理,他们希望在这里为公司的大模型业务寻找产品定义。
5月28日在中关村论坛上,中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,截至5月底,中国10亿级参数规模以上的大模型发布了79个。在此后的两个月里,又有阿里云的通义万相、华为云的盘古3.0、有道“子曰”等一系列AI大模型发布,据不完全统计目前国内的AI大模型已超过100个。
国内企业争先恐后发布AI大模型的动作,就是“应激反应”最好的体现。这种“反应”带来的焦虑,正在传导给行业里几乎所有相关人员,从互联网巨头的CEO到AI研究机构的研究员,从创投基金合伙人到AI公司的创始人,甚至是很多AI相关的法律从业者,以及数据、网络安全的监管层。
对行业之外的人而言,这可能只是短暂的狂欢,但在如今,又有多少人敢说自己置身AI之外。
AI正在开启一个新时代,一切都值得用大模型重塑一遍。越来越多的人开始思考技术扩散之后的结果。
01 资金涌入,飞轮已现
ChatGPT诞生的一个月内,出门问问创始人李志飞两赴硅谷,逢人必谈大模型,在与虎嗅交谈时,李志飞直言这是他最后一次“All in”。
2012年,李志飞创立出门问问,这家以语音交互、软硬件结合为核心的人工智能公司经历了中国两次人工智能浪潮的起伏。在上一波人工智能最火热的那一段时间,出门问问的估值一度被推至独角兽级别,但此后也经历了一段落寞期,直到ChatGPT的出现,才给沉寂多年的人工智能行业撕开了一道口子。
在一级市场,“热钱正在涌进来。”
这是过去半年中,谈及大模型时的行业共识。奇绩论坛创始人陆奇认为,AI大模型是一个“飞轮”,未来将是一个模型无处不在的时代,“这个飞轮已经启动”,而最大的推动力就是资本。
7月初,商业信息平台Crunchbase发布的数据显示,分类为AI的公司在2023年上半年筹集了250亿美元,占全球融资的18%。虽然这一数字与2022年上半年的290亿美元相比有所下降,但2023年上半年全球各行业的总融资额比2022年同比下降了51%,由此可见AI领域的融资额在全球融资总额中的占比,几乎提高了一倍。Crunchbase在报告中这样写到:“如果没有ChatGPT引发的人工智能热潮,2023年的融资额会更低。”
到目前为止,2023年AI行业最大的一笔融资,就是微软在1月对OpenAI投资的100亿美元。
虎嗅根据公开数据统计,在美国的大模型公司创业中,Inflection AI或将成为人工智能领域融资量仅次于Open AI的第二大初创公司,在其之后分别是,Anthropic(15亿美元),Cohere(4.45亿美元)、Adept(4.15亿美元)、Runway(1.955亿美元)、Character.ai(1.5亿美元)和Stability AI(约1亿美元)。
在中国,2023年上半年国内人工智能行业的公开投融资事件共有456起。而这项统计在2018年-2022年的5年间分别是731、526、353、631和648。
上半年国内人工智能行业公开投融资事件
另一个引发飞轮的事件则是ChatGPT放出API接口。当OpenAI在3月首次开放ChatGPT的API接口时,AI行业内外对此几乎形成共识:行业要变天了。随着更多应用接入大模型,AI之上正在长出更加繁茂的森林。
“做大模型和做应用本身就应该分开”,投资人的嗅觉总是敏锐的,在源码资本执行董事陈润泽看来,AI是一个与半导体分工一样的逻辑,AI大模型的繁荣之后,很快就会看到AI应用的一波繁荣。
今年年初,陈润泽与同事一起前往硅谷时发现,硅谷声名显赫的创业孵化器Y Combinator(OpenAI首席执行官Sam Altman曾在这家孵化器任总裁多年),有一半的项目都转型做生成式AI了。对于大模型的热情,丝毫不逊于如今大洋彼岸的中国。
不过,他也发现在美国无论是资本还是创业者,相比于大模型创业,更看好基于大模型所做的生态应用,毕竟在这个赛道,已经跑出了诸如OpenAI这样的公司,与此同时,美国有很强的ToB应用生态土壤,因此更多的美国公司正在尝试基于大模型的生态做企业应用。
陈润泽的观察正在得到证实,大模型服务平台OpenCSG联合创始人陈冉告诉虎嗅,如今,美国湾区90%以上的公司已经把大模型能力用到方方面面。至于中国,陈冉认为,在年底之前很多的客户也都会用起来。
今年3月左右,陈润泽和团队开始尝试在国内寻找基于大模型做应用的公司,但他发现这样的公司很少。大量资本进入了人工智能行业,但如果追溯这些资金的流向会发现,更多的钱仍集中在头部几家公司中。
“即便是现在,10个与生成式AI相关的项目,能投1个-2个也已经是很不容易了。”除了源码资本,虎嗅也与多位硬科技投资人交流,他们都表示,虽然项目看得多,但真正靠谱的凤毛麟角。
应用端的这种态度,在很多业内人士看来,已是常态。
思必驰联合创始人俞凯认为,表面看似热闹的赛道,其实更多的是名义上的竞争,结果无非两种情况:“一种是为了融钱,纯资本导向;另一种是做全域通用大模型的公司,确实需要喊,不喊的话别人不会知道。”
国内的一些统计数据也正在说明这个问题,根据第三方机构烯牛数据统计,截至2023年7月,国内有AIGC公司242家,1月以来AIGC赛道融资事件71起。而AI大模型赛道上的公司有67家,从ChatGPT发布到现在,融资事件只有21起。
AIGC赛道和AI大模型赛道自ChatGPT发布后的融资事件|数据来源:烯牛数据
“现在国内AI市场上,好的标的太少了。”一位投资人如此告诉虎嗅——好项目太贵,便宜的又不靠谱。虽然目前国内发布的AI大模型数量过百,但国内一众大模型公司中,获得巨额融资的并不多,甚至屈指可数。
很多AI投资到最后都变成了投人——曾经的独角兽公司创始人、互联网大佬、具备大模型相关创业经验的人等。
公司类型 | 公司 | 成立时间 | 大模型及相关产品 | 融资轮次 |
---|---|---|---|---|
互联网公司 | 百度 | 2012 | 文心一言 | 上市 |
阿里云 | 2008 | 通义千问 | 上市 | |
騰讯AI实验室 | 1998 | 混元 | 上市 | |
华为云 | 2019 | 盘古 | 未上市 | |
字节跳动 | 2016 | 火山方舟 | 未上市 | |
京东云 | 2012 | 言犀 | 上市 | |
昆仑万维 | 2008 | 天工 | 上市 | |
360 | 1992 | 360智脑 | 上市 |
公司类型 | 公司 | 成立时间 | 大模型及相关产品 | 融资轮次 |
---|---|---|---|---|
AI公司 | 商汤科技 | 2014 | 日日新 | 上市 |
科大讯飞 | 1999 | 讯飞星火 | 上市 | |
云从科技 | 2015 | 从容 | 上市 | |
达观数据 | 2015 | 曹植 | C轮 | |
出门问问 | 2014 | 序列猴子 | D轮 | |
智谱Al | 2019 | ChatGLM | B轮 | |
澜舟科技 | 2021 | 孟子 | Pre-A轮 | |
MiniMax | 2021 | Glow | 股权投资 | |
面壁科技 | 2022 | VisCPM | 天使轮 | |
深言科技 | 2022 | CPM | 股权投资 | |
聆心智能 | 2021 | Al乌托邦 | Pre-A轮 | |
衔远科技 | 2021 | ProductGPT | 天使轮 | |
思必驰 | 2007 | DFM-2 | IPO终止 |
公司类型 | 公司 | 成立时间 | 大模型及相关产品 | 融资轮次 |
---|---|---|---|---|
2023年成立都初创AI公司 | 光年之外 | 2023 | 暂无 | A轮 |
百川智能 | 2023 | baichuan | 股权投资 | |
零一万物 | 2023 | 暂无 | 股权投资 |
(国内AI大模型相关公司部分统计)
今年的一众AI明星项目中,智谱AI、聆心智能、深言科技和面壁智能,都是清华实验室孵化的公司。深言科技、面壁智能两家公司均成立于2022年,且有AI行业内知名学者的技术背书。
比这几家清华系AI公司成立时间更短的是一些互联网行业大佬创立的AI公司,光年之外、百川智能和零一万物均成立于这波大模型热潮开始之后。
美团联合创始人王慧文在2023年年初成立的光年之外,一度融资5000万美元,已是彼时中国大模型行业为数不多的融资案例。与智谱AI、西湖心辰这类已有大模型为基础的公司不同,光年之外是2023年2月开始,从零开始做大模型,其难度可想而知,6月29日,美团公告宣布收购光年之外的全部权益,总代价包括现金约2.33亿美元(合人民币16.7亿元)、债务承担约3.67亿元、及现金1元。
“起码要有自然语言处理背景的人,有一定大模型训练实操经验的人,以及数据处理、大规模算力集群等方面的专业人才。如果同时还要做应用,那应该还要有对应领域的产品经理和运营人才。”陈润泽如此描述一个大模型核心团队的标配。
02 大公司的AI赌注
过去半年中,老牌互联网大厂们的AI新闻漫天纷飞。对AI大模型的投入,看似是在追热点,但如百度、阿里、华为这样的大公司,在AI上投下的赌注,显然不是跟风。
巨头们在AI上的押注很早就已开始,对这些公司来说,AI并不是一个新鲜的话题。虎嗅根据企查查数据不完全统计,各大厂在2018年开始就对人工智能相关的企业有不同程度的投资,从投资企业来看,大多是人工智能应用方面的企业,尽管涉及到一部分AI芯片企业,但是数量并不多,涉及大模型方面的企业几乎没有,并且大厂所投资的人工智能相关的公司大多与其业务息息相关。
大厂投资机构 | 投资企业数 | 平均持股比例 | 最高持股比例 | 100%持股企业数 |
---|---|---|---|---|
阿里巴巴 | 23 | 36.25% | 100% | 5 |
百度风投 | 25 | 5.50% | 15% | 0 |
腾讯投资 | 54 | 17.54% | 100% | 2 |
(三家互联网大厂投资AI相关公司情况|数据来源:企查查)
2017年阿里达摩院成立,研究对象涵盖机器智能、智联网、金融科技等多个产业领域,将人工智能的能力赋能到阿里的各个业务线中。2018年,百度提出了“All in AI”的战略。
有所不同的是,生成式AI的出现,似乎是一个转折点。对于拥有数据、算力和算法资源优势的科技巨头来说,人工智能对他们已经不光是赋能场景,而是需要承担基础设施的角色,毕竟,生成式AI的出现,意味着针对人工智能产业的分工已经开始。
以百度、阿里、华为、腾讯,四家云供应商为代表的大厂,虽然都宣布了各自的AI策略,但明显各有侧重。
在过去的半年时间里,巨头纷纷发布自己的大模型产品。对于百度、阿里这样的大厂来说,他们入局大模型的时间并不算晚,基本在2019年。
百度自2019年开始研发预训练模型,先后发布了知识增强文心(ERNIE)系列模型。阿里的通义千问大模型也是始于2019年。除了百度和阿里的通用大模型,6月19日,腾讯云发布了行业大模型的研发进展。7月7日,华为云发布了盘古3.0行业大模型产品。
这些侧重也与各家的整体业务,云战略,以及在AI市场里的长期布局有所呼应。
百度的主线业务盈利能力在过去的5年中,出现了较大波动。百度很早就看到了基于搜索的广告业务在国内市场中的问题,对此,百度选择了大力投入AI技术寻找新机会。这些年来,百度不仅邀请过吴恩达、陆奇等业界大佬出任高管,在自动驾驶上投入热情也远超其他大厂。如此关注AI的百度,势必会在这波大模型之争里重手投注。
阿里对通用大模型同样表现出了极大的热情。一直以来,阿里云一直被寄予厚望,阿里希望走通技术路线创造集团的第二增长曲线。在电商业务竞争日趋激烈,市场增长放缓的大环境下,依云而生的AI产业新机遇,无疑是阿里云在国内云市场上再发力的好机会。
相比百度和阿里,腾讯云在大模型方面选择了优先行业大模型,而华为云则公开表示只会关注行业大模型。
对于腾讯来说,近年来主营业务增长稳中向好。在通用大模型的前路尚不明朗的阶段,腾讯对于AI大模型的投注相对谨慎。马化腾在此前的财报电话会上谈及大模型时曾表示:“腾讯并不急于把半成品拿出来展示,关键还是要把底层的算法、算力和数据扎扎实实做好,而且更关键的是场景落地。”
另一方面,从腾讯集团的角度看,腾讯目前有4所AI Lab,去年也发布了万亿参数的混元大模型,腾讯云投身行业大模型方面的动作,更像是一种“不把鸡蛋放在同一个篮子里”的投注策略。
对于华为来说,一直以来都是重手投注研发,过去10年里华为在研发方面的总投入超过9000亿元。但由于手机业务遇到发展障碍,华为在很多技术研发上的整体策略或也正在面临调整。
一方面手机业务是华为C端技术最大的出口,如果手机业务不为通用大模型买单的话,那么华为研发通用大模型的动力就会明显下降。而对于华为来说,把赌注押在能快速落地变现的行业大模型,似乎是这场AI博弈当中的最优解。正如华为云CEO张平安所说“华为没有时间作诗”。
不过,对科技巨头来说,无论赌注多大,只要能赌对,就能够先一步抢占基础设施的市场份额,从而在人工智能时代获得话语权。
03 拿着锤子找钉子
对于商业公司来说,所有的决策仍然落到经济账上。
即便是一笔不小的投入,越来越多有远见的公司创始人也意识到,这是一项未来必须要做的事情,即便前期投入可能完全看不到回报。
AI大模型的研发需要一笔不小的投入,但越来越多企业创始人、投资人都认为,这是一项”必要投入”,即便眼下完全看不到回报。
由此,很多在上一波AI浪潮下诞生的人工智能公司,都在沉寂良久之后看到了新的曙光。
“3年前,大家都说GPT-3是通向通用人工智能的可能性。”李志飞在2020年就开始带着一班人马研究GPT-3,彼时出门问问正处在一个发展的转折点,他们希望探索新业务,但经过一段时间的研究之后,李志飞的大模型项目中止了,原因之一是当时模型不够大,另外就是找不到商业落地场景。
不过,2022年底ChatGPT问世以后,李志飞仿佛被扎了一剂强心针,因为他和所有人一样,看到了大模型的新机会。今年4月,出门问问发布了自研的大模型产品——序列猴子。眼下,他们准备拿着新发布的大模型“序列猴子”冲刺港交所,出门问问已在5月末递交了招股书。
另一家老牌AI公司也在跟进,去年7月,思必驰向科创板递交了IPO申请,在今年5月被上市审核委员会否决。
俞凯坦言,就连OpenAI,在GPT2阶段也是用微软的V100训练了将近一年的时间,算力和A100差好几个量级。思必驰在大模型前期积累阶段,也是用更为经济的卡做训练。当然,这需要时间作为代价。
相比于自研大模型,一些应用型公司有自己的选择。
一家在线教育公司的总裁张望(化名)告诉虎嗅,过去半年,他们在大模型应用场景的探索上不遗余力,但他们很快发现在落地过程中存在诸多问题,例如成本与投入。这家公司的研发团队有50人-60人,开始做大模型研究以来,他们扩充了研发团队,新招了一些大模型方面的人才,张望说,偏底层模型方面的人才很贵。
张望从未想过从头开发大模型,考虑到数据安全和模型稳定性等问题,他也不打算直接接入API做应用。他们的做法是参考开源大模型,用自己的数据做训练。这也是很多应用公司目前的做法——在大模型之上,用自己的数据做一个行业小模型。张望他们从70亿参数的模型开始,做到100亿,现在在尝试300亿的模型。但他们也发现,随着数据量增多 ,大模型训练会出现的情况是,可能新版本不如上一个版本,就要对参数逐一调整,“这也是必须要走的弯路。”张望说。
张望告诉虎嗅,他们对于研发团队的要求就是——基于公司的业务探索AI大模型场景。
这是一种拿着“锤子”找“钉子”的方法,但并不容易。
“目前最大的难题是找到合适的场景。其实有很多场景,即便用了AI,效果也提升不了太多。”张望说,例如在上课的场景中,可以用AI大模型赋能一些交互模式,包括提醒学员上课功能、回答问题和打标签等,但他们试用了AI大模型之后,发现精准度不行,理解能力和输出能力并不理想。张望的团队尝试过一段时间后,决定在这个场景里暂时放弃AI。
另一家互联网服务商小鹅通,也在AI大模型爆发后第一时间开展了相关业务的探索。小鹅通的主要业务是为线上商家提供数字化运营工具,包括营销、客户管理以及商业变现。
小鹅通联合创始人兼COO樊晓星告诉虎嗅,今年4月,当越来越多的应用基于生成式AI诞生时,小鹅通看到了这个技术背后的潜力,“例如MidJourney,生成式AI对于设计图像生成方面的提效确实有目共睹。”樊晓星她们在内部专门组织了AI研究的业务线,寻找与自身业务相关的落地案例。
樊晓星说,在将大模型接入业务的过程中,她所考虑的就是成本和效率,“大模型的投入成本还是蛮高的。”她说。
互联网行业的“钉子”算是好找的,AI落地真正的难点还是在工业、制造这样的实体产业。
俞凯告诉虎嗅,这一波AI浪潮仍然是螺旋式上升、波浪式前进,在产业落地上面的矛盾一点都没变化,只是换了一个套壳而已。所以从这个意义上看,这两次AI浪潮的规律是相同的,最好的办法就是学习历史——“上一波AI浪潮的教训,这次就别再犯了。”
虽然很多厂商在AI大模型的落地方面都喊出了“产业先行”的口号,但很多实体产业的场景真的很难与目前的AI大模型相匹配。比如在一些工业检测场景应用的AI视觉检测系统,即便对AI模型的需求没有高到10亿参数的量级,但初期的训练数据仍然捉襟见肘。
以一个简单的风电巡检场景为例,一个风场的巡检量达到七万台次,但同样的裂痕数据,可能只会出现一次,机器可以学习的数据量是远远不够的。扩博智能风电硬件产品总监柯亮告诉虎嗅,目前风机叶片的巡检机器人还做不到100%的精确分析叶片裂痕,因为可供训练和分析的数据量太小了,要形成可靠的全自动巡检和识别,还需要大量的数据积累和人工分析。
不过,在工业数据积累较好的场景中,AI大模型已经可以做到辅助管理复杂的三维模型零件库了。国内某飞机制造企业的零件库就已经落地了一款基于第四范式“式说”大模型的零件库辅助工具。可以在十万余个三维建模零件中,通过自然语言实现三维模型搜索,以三维模型搜三维模型,甚至还能完成三维模型的自动装配。这些功能,在很多卡住制造业脖子的CAD、CAE工具中都需要经过多步操作才能完成。
今天的大模型和几年前的AI一样面临落地难题,一样要拿着锤子找钉子。有人乐观地相信,今天的锤子和过去完全不一样了,但到了真金白银地为AI付费时,结果却有些不同。
彭博社在7月30日发布的Markets Live Pulse调查显示,在514名受调投资者中,约77%的人计划在未来六个月内增加或保持
Prev Chapter:tl-rtc-file-tool:基于webrtc的媒体流传输工具
Next Chapter:GPT-5出世,需5万张H100,全球H100总需求43万张, 英伟达GPU陷短缺风暴
Beastmaster of the Ages Chapter 1889
2024-11-19Cultivation Online Chapter 971 - I Will See You in Hell!
2024-11-19Cultivation Online Chapter 1385 Ambiguous Hoarder
2024-11-19