上个月,OpenAI CEO Altman 用一张晒出的草莓照抢下了不少头条新闻。而现在,或许草莓模型真的要「成熟」了。
据 The Information 报道,作为 ChatGPT 服务的一部分,OpenAI 计划在两周内发布「草莓」(Strawberry )模型。
当然,报道也指出最终的发布日期可能会发生变化,请谨慎看待。
可靠爆料人 @apples_jimmy 则认为草莓模型将有望在本周发布。
并且他也表示,OpenAI 预计将会在 10 月份发布一个名为 GPT-4.x 版本的新模型,可能会叫做 GPT-4.5。
至于更强大的 GPT-5 模型,我听说最早可能在 12 月推出,但为了稳妥起见,我建议你们可以预期在 2025 年的第一季度或第二季度。
The Information 报道称,目前尚不清楚草莓模型将会以何种形式推出,一种可能是,草莓模型将会作为独立的产品。
另一种可能是,草莓模型将被整合到 ChatGPT 模型的选择菜单中,用户可以随意切换不同的模型服务。
之前的报道也提到,草莓模型与其他模型的最大的区别在于,它在回答问题之前懂得「思考」。
并且,草莓模型不仅在数学和编程方面表现优异,如果给它更多的「思考」时间,它还能回答客户主观性话题的问题,比如产品营销策略。
The Information 指出,草莓模型的思考时间通常会持续 10 到 20 秒,这样做的好处是帮助减少错误。
而且由于草莓模型花了更多时间来思考,这导致它能够意识到什么时候需要向客户提出更多的问题,从而全面理解用户的需求。
此外,草莓模型也与 GPT-4o 模型也有一些不同之处。比如它最初的版本并不具备 GPT-4o 的多模型能力,只能接收和生成文本回复,而不能处理图片。
The Information 认为,这可能是因为竞争对手也在推出类似的产品,所以即便这个产品在某些方面(比如不能处理图片)还不够完善,OpenAI 也只能加快推出的步伐。
对此,爆料人 @apples_jimmy 也提到, Anthropic 和 Google 也在暗中准备他们的新模型,并计划在美国大选前后推出。
再者则是一再撩拨用户情绪的订阅价格。
网传 ChatGPT 推出了一种新的付费档位 ChatGPT Pro,并且已经向部分用户推送,售价 200 美元/月,比当下的 20 美元/月贵上十倍。
倘若情况属实,这或许也呼应了上述关于草莓模型的报道。
The Information 还指出,草莓模型每小时用户的使用次数可能会和 ChatGPT Plus 一样受到限制,同时更高档位订阅价格的模型响应速度会更快。
截至发稿前,OpenAI 暂未就此事作出回应。
一层一层,切开「草莓」
OpenAI 的「草莓」模型,对我们到底意味着什么?
实际上,草莓模型的前身是「Q*」,一个在去年年底,就引起过轩然大波的神秘存在。
去年十一月,Sam Altman 毫无征兆地被踢出了董事会,他自己甚至是在会议当时被通知的,震惊了全公司,也震惊了行业上下。
董事会当时给出的理由是,他和团队在安全和风险管理方面,无法达成一致。而这个风险,就跟当时的绝密项目「Q*」有关。
这个项目原先由 Ilya Sutskever 带领,现在他已经离开 OpenAI 创业,做的就是AI 安全相关的业务。再联想到,马斯克曾经表示,这个项目「对人类构成了威胁」,很难不让人好奇这里头究竟有什么。
此前,The Information 和路透社想办法获得内部消息,最后也只能确认,数学运算能力是「Q*」的重点。
图片来自:路透社
大模型擅「文」,能娴熟地处理语言文字,已经基本上跟人类打个平手了。但是数学运算却一直不太行。即便「Q*」曾经引发 OpenAI 的巨变,据路透社透露,当时它的表现大概是小学生的计算水平。
目前已知的爆料信息显示,OpenAI 内部已经有项目能在数学运算方面,达到 90% 的准确,进步惊人。
图片来自:路透社
强调一下:现在无法确认「Strawberry」究竟做到哪一步了。
只能说,如果「Strawberry」作为「Q*」的升级版,大概率,它是一个继续在数学和计算方面寻求突破的项目。
「数学计算」和「推理」之间的关系,并不能直接划等号,但却透露着OpenAI的野心。
老说推理,究竟在说什么
那么,「推理」到底是什么?
这两个字在现实里,显然有着非常广阔的定义。今年年初,香港中文大学领衔的团队做过一个基于模型推理能力的全面整理。「推理」最根本的定义有三重:
认知推理:在不完整、不一致的知识中,得出有意义结论的能力
这种推理最常见的是拼拼图,每一个小片都是巨大图画里的一角,随便就抓两片,肯定是对不上的。
你只能举着这些小碎片,拼拼凑凑,慢慢组成一幅完成的图。这个过程中,没有说明书和步骤图,经常是要凭手感、凭直觉。
逻辑推理:根据前提,以及这些前提间的关系,有条理地得出结论,且结论在逻辑上有隐含关系或成立
数学解题就是典型逻辑推理,有已知条件,有待求的问题,根据这些,你就能一步步推算出结果。逻辑推理是目前大模型研发里「最硬的一块骨头」。
自然语言推理:这是一个整合多种知识的过程,可以是显性知识或者隐性知识,从而得出对于世界的新结论
喜欢看探案故事、推理小说的朋友,应该很容易理解。这种推理,就像是碰上了一桩凶杀案故事,书里隐隐约约有一些暗示,一些不太明确的信息,必须结合各种不同的线索,推测出谁是凶手,犯罪过程是什么。
如果只是看路透社所获得的 OpenAI 内部文件,「Strawberry」的目标是,规划、访问互联网,以及执行深度研究。
这些看上去都更像是最后一种自然语言推理,无非是更强化了一下,算不算得上是推理能力的进步都不好说。
可是,OpenAI 对于「推理」并不那么拘泥,而是有一套更宏大的愿景。
两个月前,OpenAI 创始人之一 John Schulman 在播客 Dwarkensh 上,就表示过,GPT-4 的进步,很大程度上要归功于后训练技术。
「通过后训练,去创造一个能够具备人们所关心的功能的模型,是非常复杂的」John Schulman 说,「这需要大量的投入,是大量研发工作的积累,在一定程度上就形成了壁垒。」
John Schulman 心中,对「推理」的定义是这样的:
「推理意味着需要一些计算,或者是需要一些演绎。从这个定义来看,要能够在处理任务的当时进行计算和逐步计算。」
可以看到,在他的定义里,推理和计算行为高度绑定,而且希望机器的推理是实时进行——就像人类一样,接收信息的同时,就能做分析、判读。
但是,一个人即便数学不好,也不妨碍ta有逻辑地想事情,照样能完成各种类型的推理。为什么机器的数学能力,就如此重要?
可以这样理解:数学从来都不只是做运算,它本身也是一种对信息的表达方式。
数学是一种更依赖于符号形式和意义精确性的语言,1 就是 1,0 就是 0。当使用计算符号和算式,去呈现信息时,其实比自然语言更低维。
换句话说,大模型之所以「能文」,就是建立在「会算」的基础上,将自然语言转换成了计算机语言。
这一点,早在 19 世界,就已经被历史最重要的数学家之一,乔治·布尔(就是创造了布尔变量的那个布尔),奠定了基础。
George Boole
布尔是一个有虔诚宗教信仰的人,他甚至想通过数学推理,来解释上帝的存在。
先不管他最后的结论是什么吧,他最终留给世界的财富,也就是《思维规律的探究》一书里,开篇便阐释了他宏大的目标:用微积分的符号语言,来表达推理这一思维活动的基本规律。
这也解释了为什么,一旦谈及 AI 在数学运算上的表现,人们期待的眼光里就多了几分紧张:
攻破了数学语言,或许真的就离破解思维活动不远了。
OpenAI 技术元老又双叒叕离职了
有个很奇怪的现象是,似乎 OpenAI 每逢技术内幕的大新闻,总会伴随着剧烈的人事变动。
凑巧今天 OpenAI 也有数位内部员工官宣离职。
例如, 前 OpenAI 音频 AGI 的研究主管 Alexis Conneau 宣布离职创业,而他另一个身份则是 GPT-4o 研究团队的重要技术成员。
在 GPT-4o 发布之前,他曾激动地预告这可能会开启人机交互的新时代。
曾在 Google、Meta 等大厂有过丰富工作经验的他,于 2023 年 4 月加入 OpenAI。用他的话来说,主要工作就是给 GPT 模型装上了「会说话的嘴巴」。
GPT-4o 背后的研究团队负责人 Prafulla Dhariwal 曾这样盛赞 Conneau :
Alexis Conneau 在 OpenAI 任何人之前就提出了 HER 的愿景,并且坚持不懈地付诸实践!
又或者,曾在 OpenAI 工作四年半的 Arvind Neelakantan 今天也转投「敌营」Meta AI 研究团队。
他曾参与了 OpenAI 多个重要项目的开发,包括 Embeddings、GPT-3 和 GPT-4、API 以及 ChatGPT 等。
Neelakantan 表示,在 OpenAI 的工作经历是他职业生涯的高光时刻。他将在 Meta AI 专注于下一代 Llama 模型的开发。
对此,前 OpenAI 开发者关系主管 Logan Kilpatrick 也送上离职祝福。
今年以来,OpenAI 掀起了一阵离职潮,其创始团队更是「分崩离析」。
前首席科学家 Ilya Sutskever 前脚刚宣布退出 OpenAI,后脚 RLHF 发明者之一 Jan Leike 也追随他的脚步一起离开。
离开的原因基本不重样,除了去年「宫斗大戏」的余波,也可能是出于个人职业规划等。
OpenAI 剧烈的人事变动短期内很难对 AI 竞争格局造成影响,而与此同时,在一片看衰声中,当下稚嫩的 AI 行业已然容不下长达一年的空窗期。
随着模型消息的陆续曝光,我们更期待下半年再次看到一个波澜壮阔的 AI 大航海时代。
再不济,也至少会比上半年乏味的 AI 新技术来得更有趣些。
可预见的是,AI 技术底层模型的进步,都能像一股强大的推动力,带动整个应用端的大爆发,如同当年横空出世的 GPT-4 一般,给我们带来久违的惊喜。
届时,作为用户的我们永远是最大受益者。
Prev Chapter:属于中国用户的AI手机在哪里?苹果和华为都没有给出答案
Next Chapter:马斯克:特斯拉2025年末批量装备Dojo 2 AI训练芯片,对标英伟达B200系统