五月中旬的一周内,两家公司宣布推出基于谷歌开创性突破的人工智能产品。5月13日,OpenAI 公司推出了新版支持其广受欢迎的聊天机器人 ChatGPT 的模型,该模型依赖于谷歌在2017年一篇研究论文中首次描述的技术——Transformer。第二天,谷歌宣布推出 AI Overviews,这是一种基于相同技术的产品,对一些搜索提供回答。
然而,Overviews 的发布并不顺利。该功能开始提供一些令人尴尬的建议,比如建议人们吃石头和在披萨上涂胶水。接下来的一周,谷歌实施了新的防护措施,部分描述了这些措施如何防止 Overviews 不小心将讽刺内容呈现为事实。这对一个在 AI 领域急需胜利的公司来说是一个糟糕的表现。许多科技界人士已经认为像 ChatGPT 这样的产品有可能消除对谷歌搜索的需求,而搜索业务占谷歌收入的大部分,因此其利害关系显得尤为重要。
这次失误发生在谷歌进行 AI 重大方向调整一年多后。面对 OpenAI 和其他竞争对手的巨大压力,谷歌在 2023 年 4 月表示,它将把两个精英 AI 团队——Google Brain 和 DeepMind——合并成一个被称为 Google DeepMind 的 AI“超级单位”。既提高谷歌在商业 AI 产品方面的业绩纪录,又保持公司在更具基础性的研究方面的历史优势。
据与约二十名了解公司内部运作情况的人士进行的访谈(其中大多数要求匿名),这项工作仍在进行中。
这两个实验室长期以来一直独立运作。Google Brain 是一个研究人员在宽松监督下追求激情项目的地方。总部位于伦敦的 DeepMind,由 AI 领域的知名人士 Demis Hassabis 联合创立,可能是自上而下且高度保密的。Hassabis 接任合并部门的首席执行官,大大增加了他在公司内的影响力。
过去一年中,包括谷歌联合创始人 Sergey Brin 在内的一些谷歌员工前往伦敦拜访他。Hassabis 的职业生涯主要集中在研究上,但他的新工作将不可避免地更多地关注商业化。谷歌欧洲、中东和非洲的商业主管 Matt Brittin 已开始直接与 Hassabis 的单位合作。甚至公司内部有传言称,该小组最终可能会直接推出产品。
5 月,该实验室发布了新版本的AlphaFold,这是一种预测蛋白质结构的里程碑工具。Hassabis 认为它可能发展成为一个价值 1000 亿美元的业务,但谷歌内部有些人质疑他是否应该投入如此多的时间在这个项目上。
据两位知情人士透露,该单位的主要重点是 Gemini,这是谷歌的旗舰 AI 模型。同时,内部人士表示,他们在该模型上的进展显著。AI 部门的研究人员告诉同事,他们为在 Gemini 上取得的进展感到自豪,例如其“上下文窗口”,即系统一次可以分析的信息量。对于一个拥有大量数据作为关键竞争优势的公司来说,这特别有用。
将这两个部门合并起来,发挥了 Hassabis 描述的谷歌的另一个最大优势:拥有大量从事基础 AI 研究的优秀研究人员。然而,这也有可能破坏谷歌在基础 AI 研究中取得成功的文化。
据了解实验室情况的人士透露,一些研究人员对不得不遵循他们认为来自上层的路线图感到沮丧。在合并之前,该实验室的一些最大进展来自非正式地聚集在一起的小型团队,人们有一种感觉,这种全员努力留下的实验空间更少。
据两位了解公司情况的人士称,压力已经导致一种疲劳感。Gemini 也接连遭遇问题。其发布因生成历史不准确的图像而受到影响,包括至少一张将有色人种描绘为二战中的德国士兵的图片。Hassabis 表示,他正在学习更多关于推出产品的知识,而谷歌的产品团队也在应对生成式 AI 带来的新挑战,这种技术在公众手中可能表现出不寻常的行为。他说:“这不同于普通技术产品。基础技术表现不同,具有某些优缺点。所以我认为这对我们所有人来说都是一个有趣的学习曲线。”
谷歌最终拥有两个顶级 AI 实验室,这是公司历史上一个更加自由放任时代的遗迹,当时它还拥有两个音乐订阅服务、两个风险投资集团和两个移动操作系统。Brain 来自公司的前沿技术小组 X;它在 2012 年被纳入谷歌。Brain 的联合创始人 Andrew Ng 现在是亚马逊公司董事会的成员,他说谷歌将该团队的工作融入到流行的产品中。“Google Brain 非常实用,与合作伙伴合作推出产品,为母公司创造收入,”Ng 说。
2014年,谷歌收购了 DeepMind,这是一家通过开发能够玩复古视频游戏的程序在 AI 领域取得诱人进展的初创公司。在接下来的大部分时间里,谷歌领导层认为,拥有独立的实验室是有益的,可以激发创造力并测试不同的问题解决方法。知情人士称,DeepMind 在距离加利福尼亚州山景城谷歌总部超过 5000 英里的地方运作,保持着一种独立精神。曾经是少年国际象棋冠军的 Hassabis 似乎对赢得比赛情有独钟。2016年,DeepMind 的一个模型击败了世界顶级围棋选手之一。为 Hassabis 工作的人说,他会公开地思考赢得诺贝尔奖的事情。
当谷歌在2015年重组为 Alphabet 集团时,DeepMind 被确立为一个独立但完全由 Alphabet 拥有的子公司。事后看来,这种结构注定会引发不满。DeepMind 研究人员可以完全了解 Brain 的项目和代码,他们可以自由地进入谷歌在山景城的办公室。然而,这种开放性并不是双向的:一位前 Brain 研究人员回忆说,在一次前往伦敦的旅行中,他无法进入 DeepMind 的办公室,只能在咖啡馆工作。
据了解公司运作的三位人士称,一些 DeepMind 的出版物与 Brain 正在研究的项目有相似之处,这引发了 Brain 研究人员的进一步猜疑。据一位知情人士透露,一度一些 Brain 研究人员试图阻止 DeepMind 员工访问他们的工作成果,但 Brain 的领导层敦促研究人员不要破坏实验室的开放文化。Brain 和 DeepMind 研究人员在会议上碰面时可能会感到尴尬。
DeepMind 收购几年后,Hassabis 和领导 Google Brain 的 Jeff Dean 会面,试图加强双方的联系。但这些小组继续在很大程度上独立运作,在合并前各自研究大型语言模型。Hassabis 说,Google Brain 和 DeepMind 之间的竞争并不比每个实验室内部的竞争更激烈。“大部分是合作精神和相互尊重,”他说。
然后,OpenAI 在2020年发布了一篇描述其 GPT-3 模型的论文,促使谷歌重新评估其业务运作方式。如果一个资源较少的初创公司可以利用谷歌自己的研究超前发展,也许公司需要一种更好的工作方式。
据几位了解其运营情况的人士称,一些 Brain 研究人员得出结论,他们自己的实验室需要一个明确的权力中心。任何 AI 工作的主要要求之一是访问计算能力,每个 Brain 研究人员都会获得分配,这个过程有人将其比作在嘉年华上分发游戏门票。
像 GPT-3 或 Gemini 这样规模的模型需要远远超过任何单个研究人员所能获得的计算能力,因此构建一个模型需要一组人联合他们的积分。这在竞争激烈且往往自负的学者中是一个艰难的提议。据两位了解公司的人士称,Google Brain 试图提出另一种分配访问权限的系统的尝试陷入了官僚主义。
当 Alphabet 首席执行官 Sundar Pichai 在2023年4月宣布合并时,许多谷歌校友对这一决定表示赞赏,并想知道为什么花了这么长时间。新单位首个主要产品 Gemini 的名字灵感来自希腊神话中一对双胞胎在天上融合的故事。
现为风险投资公司 Section 32 首席执行官的前 Alphabet 高管 Andrew Harrison 说,这次重组是合乎逻辑的。“他们将所有东西都整合到一个旗帜下,一套动机之下,这非常聪明。我认为它让公司内外的人都清楚地知道他们的工作是什么,”他说。“而他们的工作就是将下一代生成式 AI 技术交到他们的客户手中。”
据熟悉公司运营情况的人士称,实验室的合并“出奇地顺利和愉快”。Hassabis 说:“共同之处比不同之处要多得多。”然而,两边的一些员工表示,纯研究正在受到忽视。据一位前员工说,在合并之后,一些专注于 AI 科学应用的团队担心他们的项目会被取消。
据前员工和其他了解实验室情况的人士称,虽然没有人得到他们想要的那么多计算资源,但从事纯研究的团队所得到的资源更加紧张。但 DeepMind 一直需要在经过验证的科学工作和更具探索性的研究之间取得平衡,Sid Jayakumar 是一位 DeepMind 的研究人员,他在 2023 年离开 DeepMind 成立了初创公司 Finster AI。他说:“这种紧张关系将永远存在。”
对过于强调商业化的不满是对过去两年内部批评的镜像,当时谷歌在将生成式 AI 推向消费者方面遇到困难。据了解实验室情况的人士称,想要推出产品的研究人员离职创业,因为他们认为公司进展太慢。据了解实验室情况的人士称,Brain 研究人员也对失去品牌感到惋惜,即使一些人欢迎更强有力的领导前景。
在一定程度上,该公司正在尝试用金钱来解决其士气问题:据几位了解情况的人士称,顶级谷歌研究人员每年的总薪酬达到数百万美元。
Hassabis 也认为从事基础科学的研究人员应将商业发展视为资产。他说,他同意担任新角色的部分原因是,他相信 AI 模型正变得更加通用,开发商业产品会产生对推动研究有用的技术。“谷歌无处不在的消费者产品,提供了一个独特的测试场,用于其科学实验。我们从数百万用户那里获得反馈,”Hassabis 说。“显然,这可以极大地提高产品的质量,但也可以提高你的研究。”