就在刚刚,OpenAI预览了最新的基于强化学习的推理模型——OpenAI o1。
用官方表述来概括这个新模型的水平,就是在物理、化学和生物等能力上已经逼近人类博士水平。
不仅如此,OpenAI o1的在数学方面表现优异,例如在国际数学奥林匹克竞赛(IMO)的模拟考试中它可以答对83%的问题(GPT-4o只能答对13%);编程能力方面,则是在Codeforces比赛中达到了第89个百分位。
而之所以新模型可以做到如此,OpenAI在技术报告中表示,是因为团队使用大规模强化学习算法,通过思维链进行高效思考。
并且这种方式能够识别并纠正错误,将复杂步骤分解为简单步骤,并在当前方法无效时尝试不同方法。
具体到实际演示,OpenAI展示了三种能力:
-解决复杂逻辑难题
-解答大模型棘手的问题:“Strawberry”中又几个“r”【
-翻译一个有病句的句子
OpenAI表示,o1显著推动了AI推理的最新技术,并计划在继续迭代的过程中发布此模型的改进版本。
并且OpenAI还称,预计这些新的推理功能将提高模型与人类价值观和原则保持一致的能力。
Prev Chapter:OpenAI发布新模型,未来或不会推出GPT5
Next Chapter:一个GitHub上的开源项目: AI Shell
Alchemy Emperor Of The Divine Dao Chapter 3284: Environment of heaven and earth
2024-11-10Chaotic Sword God Chapter 3637: Slipping Through the Fingers
2024-11-15Myriad Paths of the Dragon Emperor Chapter 2505 - Chapter 2505: The ancestor of technique’s disciple
2024-11-21Unrivaled Medicine God Chapter 3023 - : Supreme Luxurious Lineup!
2024-11-20