tiknovel.com tiknovel

AI

当前位置:首页 > 技术圈 > AI

英伟达飙升8%!黄仁勋告诉高盛CEO:AI芯片需求太大了!每个客户都想要,都想变强

英伟达飙升8%!黄仁勋告诉高盛CEO:AI芯片需求太大了!每个客户都想要,都想变强

9 月 11 日周三晚,英伟达 CEO 黄仁勋在高盛组织的一场科技对谈中告诉高盛 CEO 所罗门,英伟达将在第四季度扩大产能,明年继续扩大。

黄仁勋表示,客户对 Blackwell 的需求实在太大了,每个人都想成为第一个拥有它的公司,每个人都想拥有最多的产能,每个人都想领先。他还特别提到英伟达在算法优化和架构一致性方面的优势,能够大幅提升客户的总拥有成本和竞争力。

对 AI 芯片需求巨大的言论同时间刺激了英伟达的股价,美股早盘英伟达一度转跌至 107 美元,伴随黄仁勋的讲话收盘至 116.9 美元,大涨 8.15%,增加 2158 亿美元市值,折合人民币 1.5369 万亿元。

黄仁勋强调,随着摩尔定律的终结,通用计算已经到达瓶颈,未来的关键在于加速数据中心,提升其密度和能源效率。

他预计全球将价值数万亿美元的通用数据中心会逐渐被加速计算中心所替代。通过加速SQL处理和推荐系统等核心任务,企业将实现显著的性能提升与成本节约。

未来的计算不仅局限于数据处理,还将扩展到技能增强领域。黄仁勋认为,生成式 AI 技术的应用将改变工作方式,数字助手和 AI 工具将成为各个领域不可或缺的伙伴,从而进一步推动产业生产力的提升。

他还预测,AI 计算领域的创新速度将继续加快,通过开发多种芯片与技术组合,英伟达将每两年实现性能的大幅提升,持续保持其在市场中的领导地位。

以下为这场对话的完整内容,enjoy~

所罗门:

自从你在 1993 年创办英伟达以来,你一直是加速计算的先锋。公司在1999年发明的 GPU ,推动了 PC 游戏市场的增长,重新定义了计算机,并点燃了现代 AI 时代。Jensen拥有俄勒冈州立大学的学士学位和斯坦福大学的硕士学位。

我想从 31 年前说起,当时你创立了公司。从一家以游戏为中心的 GPU 公司,转型为如今提供广泛硬件、软件服务于数据中心的企业。

我想请你谈谈这一旅程的点点滴滴。当你刚开始时,你是怎么想的,这一路上公司是如何演变的?这是一次非常不凡的旅程。或许你可以顺便谈谈,展望未来时你们的关键优先事项,以及未来的方向。

黄仁勋:

我想我们当时做对的一件事,是我们有一个愿景,那就是会有一种新的计算方式,能够补充通用计算的不足,去解决通用计算器永远无法解决的问题。

而这种处理器最开始是从计算机图形学这个对 CPU 来说极其困难的任务着手的,但我们知道它最终会扩展到其他领域。

我们选择的第一个领域是图像处理,它是对计算机图形学的一个补充。接着我们扩展到物理模拟,因为在我们选定的视频游戏应用领域,你不仅需要美丽的图像,还需要动态效果来创造虚拟世界。

我们一步步地前进,将其带入科学计算领域。我们最早的一些应用是分子动力学模拟,另一个是地震处理,基本上是逆物理学。地震处理与 CT 重建非常相似,都是另一种形式的逆物理学。我们就这样一步步前进。

我们对相邻行业和互补算法进行了思考,逐步解决问题。但从那时起的共同愿景,就是加速计算可以解决有趣的问题。

如果我们能够保持架构的一致性,意思是,今天开发的软件可以在你留下的较大算力基石上运行,而过去开发的软件可以通过新技术进一步加速。这种关于架构兼容性的思维方式,从 1993 年开始,我们一直坚持到今天。

这也是为什么英伟达的 CUDA 拥有如此庞大的安装基础。因为我们始终保护它,保护软件开发者的投资,这自始至终都是我们公司的首要任务。

展望未来,沿途我们学到了很多,比如如何成为一个创始人,如何当 CEO ,如何经营公司,如何建立公司,不仅仅是这些。这些都是新的技能。我们还学会了如何发明现代计算机游戏行业。

很多人不知道,英伟达是世界上最大的游戏架构安装基础。GeForce 拥有约 3 亿游戏玩家,增长势头依然非常强劲,充满活力。

所以每次我们进入一个新市场时,我们都需要学习新的算法,了解新的市场动态,创造新的生态系统。我们之所以要这样做,是因为与通用计算器不同,如果你构建了一个加速处理器,那么一切不会自动运作。作为加速计算器,你需要问自己:该加速什么?因为没有一种通用的加速器。

所罗门:

深入探讨一下,谈谈通用计算和加速计算之间的区别。

黄仁勋:

如果你看看软件,从你编写的庞大软件中,会发现很多涉及文件输入输出的部分、数据结构的设置以及一些包含魔法般的核心算法的部分。

这些算法因应用领域而异,无论是计算机图形学、图像处理还是其他任何领域。它可以是流体力学、粒子系统,或者像我提到的逆物理学,甚至是图像处理领域的东西。这些不同的算法都有所不同。

如果你创建了一个处理器,它在这些算法上表现得特别出色,并且能够补充 CPU 的不足( CPU 能做的事情,它就擅长做),那么理论上你可以极大地加速一个应用程序。

原因在于,通常情况下,5%~10% 的代码会占据 99.99% 的运行时间。所以如果你将那 5% 的代码卸载到我们的加速器上,那么理论上你就能将应用程序加速 100 倍。这种情况并不少见,我们确实经常做到。

例如,我们将图像处理加速 500 倍。如今我们也处理数据处理,这是我最喜欢的应用之一,因为几乎所有与机器学习相关的东西,都是数据驱动的,而数据处理正是其中的核心部分。

无论是 SQL 数据处理、 Spark 类型的数据处理,还是矢量数据库处理,所有这些都涉及到结构化或非结构化的数据处理,也就是数据框架的处理。

我们将这些处理过程加速了非常多,但要做到这一点,你必须创建相应的库。例如,在计算机图形学中,我们很幸运有像 OpenGL 和微软的 DirectX 这样的图形库。但在这些之外,几乎没有现成的库可用。

于是我们创建了自己的库,比如我们最著名的库之一,类似于 SQL 这样的库。SQL 是存储计算的一个库,我们创建了一个叫做 CuDNN 的库,它是世界上第一个神经网络计算库。

我们还有 CuOpt 用于组合优化,CuQuantum 用于量子模拟与仿真,还有像 CuDF 这样的库,用于数据框处理(类似于 SQL )。

所有这些库都需要我们去发明。我们需要重构应用中的算法,使其能在我们的加速器上运行。如果你使用这些库,那么你就可以获得 100 倍的加速,甚至更多。

这一理念非常合理,但问题是如何去发明这些算法,并让整个视频游戏行业使用它?如何让整个地震处理和能源行业使用它?如何让整个 AI 行业使用它?你明白我的意思吗?

我们必须首先进行计算机科学研究,然后进行生态系统开发,并且说服大家使用它。与此同时,我们还得确保这些库能在所有不同的计算机上运行。我们就是这样,一个接一个地跨越领域。

我们为自动驾驶汽车创建了丰富的库,为机器人技术开发了出色的库,还有用于虚拟筛选、无论是基于物理学的虚拟筛选还是神经网络的虚拟筛选的库。我们甚至还有专门的气候科技库。

所以我们一个领域一个领域地发展,结交朋友,创造市场。英伟达真正擅长的,就是创造新的市场。

我们已经做了这么久,似乎加速计算已经无处不在,但实际上,我们是在一个领域接一个领域地攻克。

所罗门:

我知道在场的许多投资者都非常关注数据中心市场。会很有意思听听你的观点,以及公司的长期和中期机会。显然,你所在的行业正推动着下一次工业革命。你觉得行业面临的挑战有哪些?谈谈你如何看待数据中心市场的发展吧。

黄仁勋:

有两件事同时发生,这两者常常被混淆,我们需要把它们拆解开来讨论。首先,让我们假设没有 AI 存在。

在一个没有 AI 的世界里,通用计算已经到达了瓶颈。大家都知道,摩尔定律和晶体管的微缩以及等功率下性能提升或等成本下性能提升的时代已经结束了。

未来,我们不会再看到每年性能翻倍的 CPU 。我们很幸运能在 10 年内看到性能翻倍的情况。

过去的摩尔定律是每 5 年性能提升 100 倍,每 10 年提升 1000 倍。我们只需等待 CPU 变得更快。然而,如今这个时代已经结束了,我们正进入一个计算膨胀的时代。

所罗门:

现在,随着摩尔定律的终结,我们正经历计算膨胀。

黄仁勋:

所以我们需要做的,就是尽可能地加速一切。无论是 SQL 处理,还是任何形式的数据处理,尤其是如果你创建了一家互联网公司,有一个推荐系统,那它绝对需要被加速。现在这些系统已经完全加速了。

几年前它们还都在 CPU 上运行,但如今,世界上最大的推荐系统这种数据处理引擎已经全都加速了。所以,如果你有推荐系统或搜索系统,或者是任何大规模数据处理系统,你必须加速它们。

接下来会发生的第一件事,就是世界上价值数万亿美元的通用数据中心将被升级为加速计算型数据中心。这一定会发生。这是必然的事情。

原因之一是我们已经到了必须要做出改变的阶段。你会看到的第一个动态是计算机的密度增加。你知道,这些巨大的数据中心非常低效,因为它们充满了空气,而空气是电的不良导体。

我们想做的是,将这些原本可能占用 50、100 或 200 兆瓦的大型数据中心,压缩成一个非常小的数据中心。如果你看看我们的一些服务器机架,英伟达的机架可能看起来很昂贵,可能每个机架花费几百万美元,但它可以替代成千上万个节点。

令人惊讶的是,光是连接旧的通用计算系统的电缆成本,可能比用一个高密度的机架来取代这些旧设备的成本还要高。

而高密度化的另一个好处是,一旦你达到了这种高密度,你就可以进行液冷处理,因为冷却一个巨大的数据中心很难,而冷却一个小型数据中心要容易得多。

所以我们现在的首要任务是加速和现代化数据中心,增加其密度,使其更加节能。你能节省资金、节省能源,并且效率大大提高。

这是我们接下来 10 年要专注的事情。现在,当然还有一个第二动态。由于英伟达的加速计算带来了巨大的成本节约,在过去 10 年里,计算能力不仅提高了 100 倍,而是提高了 100 万倍。

因此,问题变成了:如果你的速度快了一百万倍,你会做什么不同的事情?突然之间,人们说,“嘿,为什么我们不让计算机自己编写软件,而不是我们试图去确定功能或算法呢?我们只需要把所有数据、所有预测数据交给计算机,让它自己去找到算法。”

我们在如此大规模的不同数据领域上进行了这种操作,以至于现在计算机不仅能够处理数据,还能理解数据的意义。因为它能够同时理解多种模态,所以它可以进行数据翻译。

我们可以从英语翻译为图像,图像翻译为英语,英语翻译为蛋白质,蛋白质再翻译为化学分子。因此,因为它能够同时理解所有数据,它现在能够进行这些我们称之为生成 AI 的翻译操作。

可以从大规模文本生成小规模文本,也可以反过来进行文本生成,现在我们进入了一个计算革命的时代。

令人惊叹的是,第一批价值数万亿美元的数据中心已经能够被加速了。我们在 AI 中发明了这种新的缓冲技术,这种 AI 革命不仅是一种工具,更是一种技能。

这就是为什么现在创造了一个全新的行业。因为,如果你回顾整个 IT 行业,直到现在,我们一直在制造人们可以使用的工具和仪器。而这一次,我们将要创造的是能够增强人的技能。

这就是为什么人们认为, AI 将不仅仅局限于数万亿美元的数据中心,还将扩展到技能领域。

那么,什么是这种技能呢?首先是数字化技能,比如一个数字化装配线机器人,或者是数字化客户服务机器人,又比如说,一个数字化的可视化员工,专门负责计划和规划业务。

它也可以是一个数字化的 SAP 代理。我们公司使用很多ServiceNow服务,我们甚至有数字化的员工服务。因此,现在我们拥有了这些数字化的“人类”,这就是 AI 的工作方式。

所罗门:

让我们稍微退一步,换个角度思考一下。基于你刚刚说的所有内容,目前金融市场上有一个持续的争论,那就是我们是否能够在构建 AI 基础设施时,获得足够的 ROI。

你如何评估当前周期中客户的投资回报率?如果我们回顾一下云计算,在它们采用周期的类似阶段,投资回报率是如何表现的?我们现在所处的位置与当时相比如何?

黄仁勋:

在云计算之前,虚拟化是主要的趋势,还记得吗?虚拟化基本上是将数据中心中的所有硬件虚拟化为一个虚拟数据中心。

然后我们可以在整个数据中心中移动工作负载,而不是将其直接与特定计算机关联。因此,数据中心的利用率得到了改善。

通过虚拟化,数据中心的成本减少了一半甚至更多。在此基础上,我们将这些虚拟计算机推向云端,多个公司可以共享同一资源,进一步提高了利用率。

过去10到15年间,虚拟化和云计算的发展掩盖了底层发生的一个根本性变化——摩尔定律的终结。虚拟化和云计算带来了显著的成本节约,但它掩盖了晶体管缩放和 CPU 性能增长的终止。

现在,随着这些成本节约的效应逐渐减弱,我们看到的是数据中心和计算的膨胀。因此,第一件发生的事情就是加速计算。

如今,你可以在云端使用英伟达的加速器进行数据处理,比如 Spark ,这是当今世界上最常用的数据处理引擎之一。如果你使用 Spark 并在云端使用英伟达加速器,通常能看到 20 倍的加速效果。

因此,你可以节省大量计算时间,尽管计算成本会稍微增加,但整体回报率非常可观。这就是加速带来的直接ROI。

接下来是生成 AI 的第一波浪潮。在这一阶段,像我们这样的基础设施提供商和所有云服务提供商将基础设施部署到云端,让开发者可以使用这些机器训练模型或进行模型微调。

这带来了非常好的回报,因为需求非常强劲。每一美元的支出,都能带来五倍的收益。这种情况正在全球范围内发生。

像我们熟知的一些应用,例如 OpenAI 的 ChatGPT,或者像 Github Copilot 这样的工具,它们带来的生产力提升是惊人的。

如今,我们公司的软件工程师几乎都在使用这些生成工具,不论是我们自己开发的工具,还是使用 C++ 和 CUDA 进行协同生成。

未来,每个软件工程师都将有一个数字化工程师作为助手,24 小时全天候协助他们工作。这是未来的趋势。

我们公司有 32000 名员工,但我们希望通过数字化工程师将这个数字增加到 100 倍。很多行业已经在积极拥抱这一趋势。

在我们的公司, AI 已经成为计算机图形学中的重要工具。我们现在通过计算一个像素并推断出其余的 32 个像素来完成图像生成,这样可以显著节省能量和计算时间。

如果没有 AI ,我们无法支持自动驾驶行业,也无法完成机器人技术和数字生物学的研究。几乎所有的科技生物公司都在使用 AI 进行数据处理,甚至进行蛋白质生成和虚拟筛选。整个新药发现过程因为 AI 而被重新发明,这让人非常兴奋。

所罗门:

现在,让我们谈谈你的竞争优势。显然,有一些公共和私营公司在试图挑战你的领导地位。你如何看待你们的竞争壁垒?

黄仁勋:

首先,有几件事使我们与众不同。首先要记住, AI 不仅仅是关于硬件, AI 更是关于基础设施。如今的计算机不仅仅是制造芯片然后出售。

构建 AI 计算机并不是简单地组装芯片,而是构建一个完整的数据中心。比如我们的 Blackwell 系统,它由七种不同类型的芯片组成, Blackwell 只是其中之一。

Anthropic “第八位联合创始人”:Siri 这类产品不是创业公司机会,AI 在这些电商和社交领域有数十亿美元市场。

所罗门:

对,跟我们谈谈 Blackwell 。

黄仁勋:

当你想构建 AI 计算机时,大家可能会提到“超级集群”或“超级计算机”这样的词汇,因为这不仅仅是芯片或一台计算机,而是整个数据中心的构建。

如果你看看这些超级集群,想象一下运行它所需的软件吧。现在没有微软的 Windows 来运行这些系统,每个系统的软件都是完全定制的。

设计芯片的公司,也会设计这个超级计算机及其所有的软件。因此,拥有一个完全优化、更加高效和节能的系统是很有意义的。

其次, AI 涉及到算法,而我们非常擅长理解算法的需求以及如何在数百万个处理器之间分配计算工作,确保计算能够长时间稳定运行,同时实现极高的能源效率和快速的任务完成。这是我们特别擅长的领域。

最后, AI 是关于计算的,而计算的关键是安装基础。拥有相同的架构,无论是在云端还是本地,无论是在超级计算机、机器人或个人电脑上运行,拥有能够运行相同软件的统一架构非常重要。

这种一致性是我们过去 30 年坚持的原则,也是为什么如果你今天要创建一家公司,最明显的选择是使用英伟达架构的原因。

我们的架构无处不在,无论你选择什么计算设备,只要有“英伟达 Inside”,你就知道它能够运行你所需要的软件。

所罗门:

你们的创新速度非常快,我想请你谈谈 Blackwell 。它的训练速度提高了四倍,推理速度比前代 Hopper 快了30倍。你们似乎在以惊人的速度创新,你觉得能维持这样的快节奏吗?当你考虑到你们的合作伙伴时,他们如何跟上你们这种快速的创新步伐?

黄仁勋:

我们的创新节奏基于这样一个基本方法:我们每次都会开发七种不同的芯片。每种芯片的更新周期大约是两年,我们可以在每年给它们一个中期提升。

但如果你每两年推出一个全新架构,那就相当于在光速前进。我们有七种不同的芯片,它们都为性能做出贡献。

因此,我们每年都可以推出一个比上一代更好的 AI 集群或超级集群,因为我们有很多不同的组件可以进行优化。

这种规模的性能提升直接转化为客户的总拥有成本(TCO)。例如, Blackwell 的性能是前代产品的三倍,如果某个客户有1吉瓦的电力预算,那么他们的收入也会增加三倍。

这种性能提升转化为吞吐量,而吞吐量转化为收入。对那些有固定电力预算的客户来说,这意味着三倍的收入增长。没有任何其他成本节约措施能弥补这种收入增长。

因此,通过集成所有这些不同的组件并优化整个堆栈和集群,我们能够为客户提供更高的价值。

AI芯片 英伟达 黄仁勋

评论排行榜