tiknovel.com tiknovel

AI

当前位置:首页 > 技术圈 > AI

Claude 3暴打GPT4时,亚马逊云科技露出了“神秘微笑”

Claude 3暴打GPT4时,亚马逊云科技露出了“神秘微笑”

在 OpenAI 正在热火朝天地跟 Musk「扯皮」,Gemini 因为在图像中加入过量「多元化」导致政治过于正确而深陷泥潭之时,Anthropic 带着 Claude 3 模型家族仿佛横空出世般,杀了个措手不及。

这次「新王登基」究竟筹划了多久?Anthropic 是 Amodei 兄妹在 2021 年创建的独角兽公司——一家崇尚安全和以人类为中心价值观的 AI 公司(这在价值观方面与 OpenAI 有着不一样的愿景),核心创始团队均来自 OpenAI 并参与了 GPT-3 产品的早期开发。

Anthropic 创立之初就在亚马逊云科技上训练了他们的第一个基础模型,然后 Claude 2.1 迭代到 Claude 3, 就只用了短短 4 个月,Claude 3 发布后第一时间,Sonnet 模型就在 Amazon Bedrock 上支持使用,仅仅 9 天后的今天 Haiku 也在 Bedrock 上线。而时至发稿谷歌云上 Claude 3 仍然是 preview 和 coming soon 状态,而谷歌云的Vertex AI的产品栏仍然把前排位置都给了Gemini。

去年亚马逊云科技的 re:Invent 上,当时大家就很莫名其妙的发现,亚马逊云科技 CEO Adam Selipsky 采访了一位名不见经传的创业者 Anthropic 联合创始人 Dario Amodei,而以往这个位置是要留给可口可乐、纳斯达克、高盛这种大客户的。也没有太多媒体关注到当时战略合作的具体内容:Anthropic 把大部分软件迁移到亚马逊云科技的数据中心,亚马逊云科技为 Anthropic 提供从定制化的 GPU 算力到存储、数据分析等多方位支持,而且亚马逊云科技的客户将获得 Anthropic 模型的优先使用权。而且这个战略合作的「定制化程度」莫名其妙的高:1、大模型全托管服务 Amazon Bedrock 为 Claude 提供定制化服务;2、为 Claude 优化亚马逊云科技自研芯片——不断优化训练芯片 Trainium 和推理芯片 Inferentia。显然,当时我们都没注意到,Dario 的措辞异常的霸道:「这是一场『力争上游』的竞赛(a race to the top)。」

01

是一盘投资大棋?

其实,在 re: Invent 之前 2 个月,也就是去年 9 月,亚马逊才宣布对 Anthropic 投资 40 亿美金,是 Google 对 Anthropic 投资的 2 倍。业内对这次投资的评价是:显示了「金主爸爸」对 Anthropic 的强大信心,也说明了亚马逊在「生成式 AI」领域的破釜沉舟和孤注一掷。真的是这样吗?虽然 Anthropic 这 40 亿美金的投资非常炸裂,但你打开亚马逊云科技的网页一看 Amazon Bedrock 上还有另外 17 个高性能基础模型!这 17 个模型来自于 6 家公司:AI21 Labs、Cohere、Meta、Mistral AI、Stability AI,而第六家虽然是亚马逊自己,但 Titan 似乎反而在刻意让位。

AI21Labs – 2 个模型,Jurassic-2 Ultra、Mid,这是个针对多语种的大语言模型,包括葡萄牙语、意大利语和荷兰语。

Cohere – 4 个模型,是针对检索和汇总信息的大语言模型,主要是用于提取摘要、文案聚类或分类任务。

Meta – 2 个开源模型,亚马逊云科技是首个集成 Facebook 的 Llama 2 的云厂商, 这是个开源模型,目前中国区可用,好处就是客户可通过 Amazon SageMaker 对 Llama 2 进行微调。

Stability AI – 2 个模型,主要是针对图像生成功能。

Mistral AI – 2 个高性能模型,这是一家法国的 AI 公司,大模型的基本场景均可覆盖。

另外,还有 Amazon 自研的 5 个模型。

Amazon Bedrock 的吸引力,除了大模型多,还在于,它能评估和比较具体应用场景的最佳模型;用专属数据库来训练最适合自己的大模型,比如组织内各种缩写、各种名词、各种流程,训练之后让它具有专属于自己的「默契」;开源的大模型,都还可以自己再次调优;Agents for Amazon Bedrock,还能在确保数据安全和隐私保护的情况下执行业务指令,Guardrail 能对最终的生成式 AI 应用提供专属的保护措施。

于是 Amazon Bedrock 的「工程化的能力」,让它在圈内被打上了「好用」的标签。

但是,问题来了:

1、亚马逊云科技为什么要上这么多种模型?根据亚马逊云科技自己的官方说法,已经从全球 100 多个客户使用生成式 AI 的真实场景中发现:没有某个基础模型可以统治一切,甚至一个使用场景需要调用多个模型,而且要综合考虑价格。在亚马逊云科技看来,问题就从「选哪个模型更好」已经变成了「如何轻松访问」,所谓「轻松访问」,是指低多次尝试和切换模型的成本。有企业开发者说:「现在大模型的数量太多,来回切换和尝试不同的大模型一点也不智能,Amazon Bedrock 就一个「call」,想调那个调那个。而且什么任务都调用庞大的大模型,成本高,也承受不起。」

2、模型多,可以。但亚马逊云科技为什么不主推自己的模型?

有一条时间线很能说明问题,Bedrock 发布的时间是 2023 年 4 月,像 Meta(23 年 7 月上线)、Cohere(23 年 7 月上线)、Mistral AI(24 年 2 月底上线)这些「明星」AI 公司的大模型都是在 Bedrock 发布之后才陆续登陆这个平台。也就是说,亚马逊云科技从一开始就赌定了「淘金热里卖铲子」这一赛道。

或许,除了永远沉迷于客户需求(亚马逊称之为「Customer Obsession」),更重要的原因就是:云计算平台,原本就应该是个「集市」,Market Place,而一个公共的基础设施重要的是能够为优质的入住玩家提供更好的服务——云计算是工程化的「商场」服务——这才是本质。

02

投资生成式 AI

只是买买买吗?

看到拥有强大功能的 Amazon Bedrock 和 17 个领先的基础模型,你以为布局生成式 AI 只是在市场上买买买吗?不!你想买空市场所有存货,人家还不见得想让你投呢,为什么?因为你的基本盘「技术底座」不行。生成式 AI 是非常烧钱的行业,成本主要包括算力、算法和数据三个方面。当我们把更多的目光投向算法的时候,总是容易偏颇的忽略算力。这是亚马逊云科技 最具有竞争力的部分。

引用 VentureBeat 的报道:「亚马逊云科技正在生成式 AI 领域进行全栈式布局,包括云基础设施、基础模型和面向用户的应用。」

亚马逊云科技在生成式 AI 的「全栈式」布局:最底层是训练和推理的基础设施层,各类超级芯片(自研+NVIDIA) 为基础模型训练和推理提供超级算力;中间层是以 Amazon Bedrock 为主的模型全托管服务;上层是生成式 AI 应用层,包括生成式 AI 助手-Amazon Q 和 AI 编程助手 Amazon CodeWhisperer。

这样看来,亚马逊云科技正在凭借着极其稳固的基本盘,与像 Anthropic 一样的大模型「先锋」,在玩一场鸡生蛋、蛋生鸡的游戏——或许这就是贝索斯的飞轮效应:货多了-场活了-人多了-场大了-货便宜了-人更多了-场更大了……

看懂了亚马逊云科技在生成式 AI 这场浪潮里的独特占位,我就一直试图找到亚马逊云科技挑选大模型的标准:既然选了很多,又没有都选,那标准是什么?有一个词反复的跳出来,吸引了我的注意力「Constitutional AI」,它的直译是「宪法 AI」。官方给出的解读是:亚马逊云科技强调帮助企业建立公正、可解释、稳健、透明、可治理、确保隐私与安全的「负责任的 AI」。在字里行间的反复暗示中,我发现这个词的正确解读,不应该是它是什么?而是它不是什么——它不是 General AI。或者说,它不是一个比照人、超越人、无所不能的人造上帝。具体来说,确保用户用自定义模型将数据保留在客户自己的企业内网,任何数据都不会用于训练底层模型。这会不会是亚马逊云科技挑选大模型的标准?我并没有得到亚马逊云科技的官方回应。

03

结尾

在大家都在卷自建大模型的时候,亚马逊云科技更倾向于为大模型提供「淘金的铲子」——作为云计算的开创者、迄今为止云计算领域的老大,亚马逊云科技在生成式 AI 时代的战略占位、对「云是公共服务」这一本质的认知逻辑,值得我们今天中国云计算厂商思考。没错,公共服务是规模效益,公共服务是稳定第一,公共服务是成本降低、价格下降,但这只是结果,前提是绝对优秀、值得信赖的工程化能力。

其实,本质上,亚马逊云科技是在凭借平台优势的一己之力,卷更多的大模型。它不是不卷而是卷更多

那么就还有最后一个「看似显而易见,但深究却不得其所」的问题:为什么云厂商都在卷大模型?是怕生成式 AI 另辟赛道抢了云计算的风头吗?显而易见,是因为业内人士会认为这是个伪命题,大模型根本无法离开算力。

那云计算厂商,究竟在卷什么?

2022 年,亚马逊云科技的 re: Invent 上的一个概念或许给出了回答「Data Gravity」,它的基本理念是指:数据在哪里,资源就在哪里,趋势就在哪里。数据就像具有引力一样,吸引着一个又一个的技术潮流奔向它,比如 2021 年的 Data Lake。这句话放在今天的生成式 AI 同样成立。

过去经常提到「数据驱动型」(Data-driven),数据驱动型企业、数据驱动型决策、数据驱动型应用、数据驱动型硬件设计……我们过去更多的关注到了「数据」俩字,或许更重要的是「驱动」,数据如何「驱动」?就是今天强大的 AI。说到底,云厂商从诞生的那一天起,就已经清楚的知道数据、AI、云缺一不可。草蛇灰线伏延千里,今天的生成式 AI 其实一直在那里,这盘大棋一直在下。我们看的是热点,他们早就看到了自己宿命的未来。


评论排行榜