在股价上呈现追赶苹果之势的英伟达,先在产品上学了苹果一招。
北京时间3月19日对外发布的B200 GPU芯片上,英伟达首度采用了芯片封装设计,即在一个大芯片上集成了两个相同制程工艺的小芯片。
如何在无法提升制程工艺的前提下,实现芯片性能的进一步突破?苹果在2022年的MI Ultra芯片上率先给出了解题思路——将两个M1 Max芯片组合在一起,构成了MI Ultra,在同样制程工艺基础上实现了性能的提升。
被黄仁勋视为地表最强AI芯片B200发布后,包括微软执行董事长兼首席执行官萨提亚·纳德拉、Alphabet和谷歌首席执行官桑达尔·皮查伊、亚马逊总裁兼首席执行官安迪·贾西等一众云服务厂商大佬纷纷站台支持。
特斯拉及xAI首席执行官埃隆·马斯克也不吝溢美之词:“当下的AI领域,英伟达硬件无可比拟。”
在生成式AI这股火爆趋势中充当“AI军火商”的英伟达,凭借此前发布的A100、H100等GPU,股价自2023年迎来暴涨,总市值相继迈过1万亿美元、2万亿美元,目前成为仅次于微软和苹果的美股第三大上市公司。
英伟达的另一面,在AI领域投入较慢的公司,则正在承受掉队的代价。在移动互联网时代执牛耳的苹果,一度是标普500指数中贡献最大的一家公司。受困于在生成式AI布局方面的迟缓,苹果股价年内累计下跌近10%,总市值从3万亿美元高点滑落至当前的26826亿美元。
但面对年内不到一个季度,股价便累计暴涨近八成的英伟达,资本市场也开始产生分歧,部分机构从看涨变为套现离场,如方舟投资管理公司基金经理凯茜·伍德(人称“木头姐”)。
看着英伟达股价几乎每天都在创造新纪录,近期,瑞穗证券分析师Jordan Klein在一份报告中提醒道,“感觉有点不健康,让人想起1999年和2000年疯狂的科技市场心态。”
随着投资者“恐高”情绪的蔓延,Jordan Klein等分析师试图给过热的市场降温。花旗更是在报告中指出,英伟达面临的回调风险正在加剧。
在资本市场已经显现出分化局面的情况下,尽管有B200芯片的全新加持,英伟达当天股价也经历了一波大涨到微涨的变化,股价涨幅从盘中超4%,下落至收盘后的0.7%。
盘后,英伟达股价下跌1.76%。
面对每一次技术浪潮带来的市场变革,50 Park Investments创始人兼首席执行官亚当·萨兰表示,“我们一次又一次地看到当投资者被当下的技术创新理念所吸引时,逻辑就会被抛到一边。当感性占据上风,股价就有无限上涨空间。”
英伟达,无疑正成为当下投资者理性与感性博弈的风暴中心。
继两年前推出Hopper架构后,英伟达带着全新一代的Blackwell再次震撼AI界,黄仁勋希望以此开启AI的变革时刻。
基于Blackwell架构开发的B200芯片,在制程工艺上延续了H100的5nm,不过为了尽最大可能提升算力,英伟达在B200上首度采用了封装工艺,B200由两个基于台积电4NP工艺的Blackwell GPU组合而成,总晶体管数量达到2080亿个,是H100(800亿)的2倍多,且能够提供高达20 petaflops的算力,是H100(4 petaflops)算力的5倍。
(左为B200,右为H100)
性能提升的同时,B200在成本和能耗上,相比H100,最高可以降低25倍。叠加B200搭配的8颗HBM3e内存,最大可支持10万亿参数模型的训练。作为对比,OpenAI的GPT-3 模型参数为1750 亿,据黄仁勋透露,GPT-4模型参数约为1.8万亿。
以训练一个1.8 万亿参数模型的GPT-4为例,之前需要用8000个Hopper GPU干的活儿,现在用2000个Blackwell GPU就能做到,且功耗还减少至原来的约1/4,即从15 兆瓦降至4兆瓦。
如果想要更强性能,用户只需把两个B200 GPU与一个Grace CPU相结合,就能搭建为GB200超级芯片,其可以为大语言模型的推理环节提升30倍的工作效率。
在具有1750 亿个参数的 GPT-3 LLM 基准测试中,GB200的性能是H100的7倍,训练速度则是H100的4倍。
值得一提的是,Blackwell并非某一款芯片的专属名,而是指代英伟达的新一代芯片平台。基于该平台,英伟达提供有多种服务器节点规格,性能从小到大依次为:HGX B100,HGX B200,以及GB200 NVL72。
HGX B100配备x86 CPU和8个B100 GPU。HGX B200使用8个B200 GPU 和1个x86 CPU。最强大的GB200 NVL72系统,则配备36颗Grace CPU和72块Blackwell GPU,具有1440Peta FLOPSde FP4 AI 推理性能,和720 Peta FLOPS的FP8 AI训练性能。
“一个GB200 NVL72机柜可以训练27万亿参数的模型。”黄仁勋介绍道。这意味着,一个GB200 NVL72机柜,便可以撑起约15个GPT-4参数规模的大模型。
不过,英伟达并未明确给出B200芯片的具体上市时间和价格,只表示将于今年晚些时候发货。届时,亚马逊、谷歌、微软和甲骨文,将成为首批提供Blackwell芯片驱动的云服务提供商。
除了制程工艺上的停滞,会让外界担忧英伟达继续保持AI芯片领先姿态的持久性外,高涨的AI热情可能带来的库存挑战,也让部分投资机构打起退堂鼓。
“以2017年为例,那时加密货币行业的兴起导致对英伟达GPU需求激增,一度导致市场对其需求过于旺盛,即市场参与者急于购买GPU,以至于出现了超出正常需求的多倍订购,这最终导致了库存积压。每当我听到为了应对短缺而进行双倍订购、三倍订购、四倍订购时,我都会远离。”
现实层面,一众大公司的确在争相抢购英伟达芯片:扎克伯格宣布要建立一个“大规模计算基础设施”,到2024年底将包括近60万个GPU储备,其中涵盖35万张英伟达H100显卡;亚马逊也开始筹划建设世界上最快GPU推动的AI超级计算机,计划配置超过1.6万张英伟达GH200超级芯片。B200芯片发布后,亚马逊率先表态,称AWS已计划采购由2万张GB200超级芯片组建的服务器集群。
在越来越多大公司以高于实际需求而抢购英伟达芯片之际,后者供货的速度却远远达不到预期。
在四季度财报会上,黄仁勋再次提醒道,来自供应链的短缺,正加剧芯片供应现状。
无论是上一代H100,还是全新一代的B200,都需要用到HBM内存。生成式AI爆发之前,因为成本高昂,HBM模式并未得到大规模市场化,全球预备产能并不多。目前SK海力士独占HBM近一半市场份额,即便加上新入局的三星和美光,其能否满足英伟达需求都成问题,更何况还要将原本就捉襟见肘的产能,分润给英伟达的竞品,如谷歌、AMD等自研AI芯片。
HBM环节之外,一颗英伟达AI芯片的最终诞生,还需要经过台积电的CoWoS封装。在5nm工艺节点下,目前仅有台积电可以大规模量产CoWoS先进封装。原本供应H100都不够用的CoWoS封装产能,如今还得给同样采用5nm的B200让路。
而不论是HBM还是CoWoS,想要进一步提升产能,都至少需要近一年的时间提前规划。
因供不应求而无法满足市场需求的英伟达,也给后来者留下了竞争的生存空间,AMD、谷歌、微软、亚马逊、Meta等已有的友商之外,一些新的竞争对手仍在不断赶来。
进入2024年,奥特曼开始喊出7万亿美元的芯片全产业链制造计划,软银创始人孙正义被爆出正寻求高达1000亿美元资金,计划打造抗衡英伟达的AI芯片巨头。
随着越来越多公司加入AI芯片产品研发队列,不排除会进一步加剧未来市场上的AI库存压力。
相比芯片库存所带来的远期泡沫,不少投资者在英伟达不断刷新纪录的股价面前,已经开始出现“恐高”情绪,越来越多的声音试图给过热的市场降温。花旗报告中指出,投资市场呈现出过度乐观和“一边倒”的趋势,股市面临的回调风险加剧。
瑞穗证券分析师Jordan Klein表示,投资者似乎陷入了“纯粹的追逐模式”,这种市场行为导致半导体股价格不断走高,形成了一种“自我强化”的趋势。“投资者应该记住,英伟达等AI芯片股‘不可能每天都上涨’,就像最近看起来不自然的行情那样。”
“木头姐”率先付诸行动。从2023年四季度开始,木头姐抛售英伟达的力度逐渐加大。对于抛售行为,木头姐对外解释:“2014年,多数投资者还把英伟达视作一家PC游戏芯片公司,我们就选择以5美元的价格买入。如今,英伟达的收益已经超过了150倍,我们选择获利了结。”
在3月份致股东的一封信中,木头姐进一步对英伟达敲响警钟,警告其惊人的增长可能会放缓。“从长远来看,与思科的历史轨迹相异,英伟达的竞争环境可能会更加严峻。这不仅仅是因为部分竞争对手正在逐步取得市场成功,更关键的是,英伟达的主要客户,包括云服务提供商和特斯拉等公司正在积极设计自主的人工智能芯片。”
自2000年互联网泡沫破裂后,思科股价在随后几年内暴跌约90%,此后一直未能回到互联网泡沫巅峰时期。在木头姐看来,今天的英伟达,就是昨天的思科。“正如当年思科交换机和路由器引发互联网革命一样,英伟达是推动人工智能革命发展的关键公司,所以它的股价也会经历较大的起伏和波动,就像思科在股市上经历的那样。”
但相比思科当年高达100倍的市盈率,以及频繁的大额投资和收并购行为,当前的英伟达市盈率仍维持在不到30倍低水平,同时借助其不断增长的营收和利润,英伟达资产负债表也要好于思科。
但正如Jordan Klein所言,没有一家公司的股价会一直上涨。投资者谁也不敢保证自己会不会买在了高点。