经历多日的传闻,昨晚,谷歌开年“王炸”正式登场!
钛媒体App获悉,北京时间2月8日21点,正值GoogleBard推出一周年之际,科技巨头谷歌(Google)正式宣布一系列在 AI 领域的最新进展:
1、谷歌把对标ChatGPT的 AI 聊天机器人平台Google Bard,更名为Gemini。
2、Gemini发布安卓版本的独立App(目前似乎仅支持Pixel),并将在Google iOS和安卓版本中内嵌Gemini对话功能。其中,在安卓独立App上,用户可以选择使用Gemini替代原来的 Google Assistant,成为手机的默认语言助手。
3、历经60天等待,谷歌正式向公众发布史上性能和功能最强大的Gemini Ultra 1.0模型,并推出基于此模型的付费Gemini Advanced产品,用户需每月支付20美元,选择Google One AI Premium(高级)版本。
4、谷歌大模型能力将接入Google Workspace(包括 Gmail、Docs、Meet 等应用)和 Google Cloud 中。此前两款产品内置的 Duet AI 产品都纳入Gemini品牌,并重新命名,如Gemini for Workspace等。
很显然,在经历ChatGPT一年多的爆火之后,谷歌不仅要“奋起直追”,还希望统一资源,让Gemini成为行业“头雁”。而Bard和Duet都消失了,Gemini 或将成为未来谷歌推向世界的唯一 AI 模型和产品系列。
“我认为这是构建真正 AI 助手的非常重要的一步。”Google Bard(现为 Gemini)负责人 Sissie Hsiao表示。
谷歌和Alphabet 公司CEO桑达尔·皮查伊 (Sundar Pichai) 对《连线》杂志表示,全新、功能更强大的谷歌Gemini聊天机器人是一项创新“实验”,利用 AI 重塑其核心搜索产品并形成生成式 AI 搜索体验,旨在为用户提供一种无需搜索引擎即可查找信息并完成工作的方法。
《连线》直言:谷歌正在对不再成为“搜索引擎王者”的未来做好准备。
从追赶到比拼,谷歌大战OpenAI
过去超过14个月,开启了全球新一轮 AI 热潮。而随着ChatGPT风靡全球,深耕 AI 多年的谷歌可谓是被OpenAI “偷家”了。
2023年2月8日,谷歌紧急推出基于LaMDA对话语言模型的 AI 聊天机器人产品Bard。在此之前,谷歌内部发起“红色代码警报”(Code red),创始人拉里·佩奇和退隐多年的谢尔盖·布林重回公司,并斥资接近4亿美元投资 OpenAI 的对手 Anthropic,以对抗微软和OpenAI的“强强联合”。
然而,为应对ChatGPT,谷歌Bard研发时间很短,仅数月而已。所以,Bard发布之后用户晒出多个错误性回答,被市场广受诟病,最终导致谷歌市值大跌。
2023年5月12日,经过不断技术迭代和优化之后,谷歌乘胜追击,推出比Bard更强大的PaLM 2模型,重点改进模型的多语言翻译、数学、程序语言、推理和自然语言生成能力。同时,Bard也正式面向全球180个国家地区开放使用,并扩展至40种语言,对话能力已有明显提升。
去年12月,经历半年多的不断模型训练和产品迭代,谷歌正式推出迄今为止功能最强大、最通用的多模态通用大模型:Gemini(中文称“双子座”),共包括三个不同尺寸版本:Ultra(超大杯)、Pro(大杯)和Nano(中杯),将全面内置最新、最强大的自研 AI 超算芯片Cloud TPU v5p。
谷歌表示,在六项基准测试中,Gemini Pro性能表现优于GPT-3.5;而在30项性能基准测试中,Gemini Ultra超越了目前最强模型GPT-4,甚至Ultra在MMLU测试上得分高达90.0%。
简单来说,在数学、物理、法律等57个领域测试中,Gemini Ultra成为全球第一个超越人类专家水平的 AI 模型。
如此强大的 AI 技术,谷歌必然要持续推进,不仅统一了 AI 人才和算力资源,而且全力投资Gemini,并在今年1月的全球一项大模型基准测试中超越GPT-4。
如今,谷歌再度公布多项关于Gemini大模型的新进展。
皮查伊指出,AI 现在是谷歌发展迅速的两大业务——谷歌云和Workspace,Google One的核心。
其中,Google One的付费订阅用户即将突破1亿人。
在皮查伊看来,Gemini的演变不仅仅是模型,而是要支持整个谷歌 AI 生态系统——从数十亿人每天使用的产品,到帮助开发者和企业创新的 API 和平台。包括文本、图像、音频和视频中都将采用最强大的Gemini模型。
具体到产品中,Bard将更名为Gemini,网站也从bard.google.com,转到Gemini.google.com,网页版支持40种语言,并将在 Android 和 iOS 的“Google”应用App上推出新的Gemini对话功能。
另外,在Pixel 8系列安卓设备中,谷歌上线了Gemini独立 App,并可以通过语音等方式实现搜索与对话。
据悉,即日起,Gemini在美国的Android(安卓)和 iOS 设备上推出英语版本,并将在未来几周内全面推送给所有用户。从下周开始,用户将以英语、日语和韩语访问它,并且即将推出更多国家/地区和语言。
与此同时,大多数用户仍将使用Gemini模型的标准版本,称为Gemini Pro。如果使用该模型最强大的版本 Gemini Ultra,用户必须注册Gemini Advanced付费订阅,每月20美元,是全新Google One AI Premium会员计划的一部分,此外还有2TB 的 Google Drive 存储空间、Google One订阅的所有功能、谷歌 AI 产品的优先权等。
新的Gemini Advanced,在推理、遵循指令、编码和创造协作方面的能力更强。
全新Google One付费计划(图片来源:谷歌官网,图片中的中文信息来自 AI 翻译,仅供参考)
比较有趣的是,Gemini Advanced版本的价格与ChatGPT Plus等产品相同。The Verge评价称,这似乎会让更多用户接受它,因此20美元是美国 AI 付费产品的普遍性价格。
另外,谷歌还将Gemini引入到Workspace、Google Cloud等更多谷歌产品中。其中,Workspace方面,内置的Duet AI 即将变成 Gemini for Workspace,同时AI Premium会员用户也将在Gmail、Docs、Sheets、Slides等产品中使用Gemini功能;Google Cloud方面,Duet AI 也将在未来几周变成 Gemini,而且Gemini也将帮助企业提高生产力,帮助开发者更快地编码等。
皮查伊表示,Gemini的多模态技术,是与ChatGPT、微软Copilot AI的重要区别元素之一。这意味着,Gemini接受了多种格式的数据训练,不仅是文本,还包括图像、音频和代码。
据谷歌公布的一组数据,在谷歌搜索中内置Gemini模型,能够为用户提供更快的搜索生成体验(SGE),而且在美国的英语搜索结果延迟降低40%,同时在搜索结果质量方面也有所提高。
但皮查伊也坦言,虽然 AI 对人类的变革将比火、电力的诞生意义更大,但Gemini 1.0可能不会改变世界,而最好的情况是,Gemini可能会帮助谷歌在生成式 AI 军备竞赛中赶上OpenAI。
“从某种意义上说,随着搜索的发展、移动设备的出现和用户交互的变化,Gemini将成为用户未来在生成式 AI 搜索领域的领先技术,”皮查伊认为,谷歌希望对未来保持灵活性,否则将就会出现战略性失误(出错)。
谷歌方面透露,下周该公司会针对为开发者和Cloud客户推出更多产品信息,而且谷歌已经开始训练下一代 Gemini 模型。
谷歌在 AI 大战中找到感觉了?
作为Transformer架构的提出者,谷歌在 AI 领域持续投入长达数十年,但在2023年, AI 领域的最大风头却更多被微软和 OpenAI“抢走”。
ChatGPT正式发布至今,周活跃用户数超过1亿人;目前有超过200万开发者和客户在该公司的API上进行开发;世界财富500强公司中,有92%的企业在使用其产品。
这一系列惊艳表示,引发全球 AI 新热潮。谷歌、微软、苹果、亚马逊、阿里、腾讯、百度等中美科技巨头纷纷重金投入 AI 大模型赛道当中,如今已形成了“百模大战”这样一个新的 AI 市场格局。
以苹果公司为例。据调研机构Stocklytics公布的最新报告显示,2023年,苹果共收购了32家AI初创公司,在美国科技巨头收购相关公司数量上位居榜首。同时,自2017年以来,苹果在 AI 技术领域的股权和附加投资方面约占全球投资总额的 21%,位列榜首,微软、Alphabet则排名第二、三位,份额分别为12%和8%。
彭博社指出,苹果即将推出一个名为 "AppleGPT"聊天机器人产品,目前已在内部测试,有望在今年将 AI 技术应用于苹果产品当中。
在过去一年多的技术迭代和应用落地下,谷歌似乎也已经在这场 AI 大战中找到感觉了。
今年1月31日,谷歌母公司Alphabet(NASDAQ:GOOGL)公布了2023年第四季度财报。
财报显示,四季度,公司实现营收863亿美元,同比增长13%;净利润同比增长51.84%,至206.87亿美元。其中,在 AI 技术驱动下,谷歌云业务收入同比增长25%。
尽管 AI 促进了谷歌云业务,但由于大模型训练需要大量的算力、数据和资本投入,却导致谷歌资本支出大幅增加,去年第四季度,谷歌资本支出同比增加45%至110亿美元,超过了2022年同期,因此,市场对于 AI 未来是否“盈利”,依然产生怀疑。
The Information 的 Martin Peers 分析认为,目前大幅投入 AI 的科技公司,最后都需要证明自己的投入是否能够得到经济回报。而谷歌的母公司 Alphabet,没有表现出与微软这种大规模 AI 业务收入。
“不过 Alphabet 和微软一样,有收益的潜力。”Martin Peers称。。
当前,中国、美国两个国家正全面发力 AI 大模型技术和应用。
2月8日,美国政府宣布,OpenAI、微软、Meta、谷歌、苹果、亚马逊、英伟达等200多家公司正加入美国商务部成立的新的 AI 安全研究联盟当中;而中国市场,截至2023年10月,中国公开的 AI 大模型数量已达238个,与美国 AI 大模型产业分庭抗礼,同时从政府到产、学、研,中国都全面支持 AI 技术和产业的快速发展。
IDC 数据显示,2023年,中国 AI 市场支出规模将增至147.5亿美元,预计2026年实现264.4亿美元支出,年复合增长率(CAGR)将超过20%;据艾瑞咨询报告,预计到2027年,AI 产业规模将达到 6122 亿元。
面壁智能联合创始人、CEO李大海近日对钛媒体App表示,随着时间推移,AI 大模型应用可能会“百花齐放”,然而通用基座(千亿)大模型不会太多,可能只有极少数的几家公司最终能“突出重围”。
“未来逐步有些公司会更多往‘应用层’去发展,关于基座模型,相关类型大模型公司不会太多,虽然不会只有一家,但具体是几家我们也不清楚,这个是很难预测的一件事情。”李大海对钛媒体App表示。
皮查伊公开表示,谷歌目前重点是提供正确的生成式 AI 体验。可以想象同一个用户在免费搜索和Gemini 订阅之间来回切换。换句话说,AI 搜索将不再是“配菜”,而是“主菜单项”——尽管价格更昂贵。
但皮查伊也承认,谷歌Gemini Pro、Ultra依然有产生“幻觉”的风险,而谷歌团队正努力减少模型失控的现象。他坦言,“幻觉”这个词应该谨慎使用,并认为幻觉既是一个特征、也是一个对错误信息的“令人着迷的重塑”。他认为,AI 技术应该以事实为基础,但如果把它调整太多,Chat聊天将就会变得非常无聊。
美国咨询公司Stifel分析师表示,Alphabet产生了“健康的广告效果,但还不够”。鉴于谷歌的规模和主导地位,市场对谷歌的期望太高。
皮查伊强调,生成式 AI 体验应该是“富有想象力的”,目前有点类似于互联网早期时代的“探索”。
那么,随着2024年成为大模型应用年,未来谷歌能否占领生成式 AI 业务高地,在这场 AI 军备竞赛中胜出,一切仍有待时间给出答案。
Prev Chapter:Brilliant Labs发布全球首款集成多模态AI眼镜Frame
Next Chapter:AI芯片需求激增,HBM内存价格暴涨500%