今天凌晨,在美国丹佛举行的第 51 届 SIGGRAPH 图形大会上,英伟达创始人兼 CEO 黄仁勋和 Meta 创始人兼 CEO 马克·扎克伯格举行炉边谈话。
他们讨论了 AI、开源大模型、仿真模拟的未来、下一代计算平台,以及智能眼镜及其与 AI 的集成等众多热议话题。
在现场,扎克伯格与黄仁勋也上演了一场「球衣交换」。 扎克伯格特地订购了一件黑色毛领皮大衣,而黄仁勋也将自己标志性的皮外套与扎克伯格交换。
扎克伯格调侃道,「你的这件衣服显然更值钱,因为它是被穿过的。」
部分金句如下:
黄仁勋:
我认为很少有人意识到,推荐系统是世界上设计出的最大计算系统之一。
我认为 Lama 2 可能是去年 AI 领域最重大的事件。
当我们面对一个任务或问题时,我们通常会考虑多个选项,甚至可能构建一个决策树来考虑每种可能的选择所带来的不同结果。这就是我们在进行规划的过程。未来的 AI 也将执行类似的操作。
扎克伯格:
Meta AI 的概念是拥有一个能够帮助处理各种任务的 AI 助手
如果你回顾过去,苹果在封闭系统方面有所作为。但微软,虽然它不是一个完全开放的公司,但与苹果相比,Windows 运行在有不同的 OEM 和不同的软件、硬件上,形成了一个更加开放的生态系统。
我们确实会做一些封闭源代码的项目。我们发布的并不都是开源的。但我认为,对于整个行业正在构建的计算平台,尤其是软件开源,这将为整个行业带来巨大的价值。
至少我不认为会有一个主要的 AI 代理,每个人都在同一水平上与之交流。我不认为会有一个模型被每个人使用。
我认为智能课程和混合现实头戴设备都将存在于我们的世界中。我认为智能课程将类似于移动手机,是下一个计算平台的一种始终在线的版本。
我们离拥有全息眼镜还有一段时间。不过,我认为在一副时尚的、更厚框架的眼镜中实现这一点并不遥远。
附上直播链接:https://www.nvidia.com/en-us/events/siggraph/
以下是黄仁勋和扎克伯格的对话实录(有删减):
黄仁勋: 这里是 SIGGRAPH。你知道,这里聚集了众多博士。
SIGGRAPH 最棒的地方在于,它是计算机图形学、图像处理、AI 和机器人技术融合的盛会。多年来,许多公司在这里展示了他们的惊人成就,包括迪士尼、皮克斯、Adobe 和 Epic Games。
当然,英伟达今年在这里也取得了显著成果。我们在 AI 和模拟的交叉领域推出了 20 篇论文。
因此,我们正在使用 AI 进行帮助模拟,规模更大,速度更快。AI,我们正在使用仿真来创建用于合成数据生成的仿真环境。
这两个领域真的融合在一起了,我为我们在 Meta 所做的工作感到非常自豪。你们做了惊人的 AI 工作。
请记住, 我们都受益于 Meta 开发的 PyTorch,它在计算机视觉、语言模型以及实时翻译等领域取得了开创性的成果。
我想问你的第一个问题是,你如何看待 Meta 目前在生成式 AI 方面的进展,以及你是如何利用这些技术来优化运营或开发新能力的?
推荐系统是世界上设计出的最大计算系统之一
扎克伯格:是的,这里有很多内容需要探讨。首先,我真的很高兴能来到这里。你知道,Meta 做了很多工作,并且多年来一直参与 SIGGRAPH 会议。
与你們这些资深参与者相比,我们还只是初来乍到,但我想那是在 2018 年,你那次著名的演讲,对吧?我只是想说,谢谢你们欢迎我来到你们的地盘。
我认为是在 2018 年,我们展示了我们 VR 和混合现实头戴设备的一些早期手部追踪技术。
我想我们已经详细讨论了我们在高保真化身技术方面取得的进步,这些化身可以从消费者的头戴设备中驱动,我们正逐步实现这一目标,对此我们感到非常兴奋。
此外,我们在显示系统方面也做了大量工作。我们正在进行的一些未来原型和研究旨在使混合现实头戴设备变得更加轻薄。这需要使用先进的光学堆叠技术和集成显示系统。
我们通常首先在这里展示我们的最新成果,所以今年能来参加感到非常兴奋,我们不仅讨论了反向工程的内容,还涉及了所有与 AI 相关的领域。
正如你所说,我们从 FAIR,即 AI 研究中心开始。那时还是 Facebook,现在是 Meta,在我们成立 Reality Labs 之前,我们已经在这个领域耕耘了一段时间。
生成式 AI 技术正在引发一场有趣的革命。我认为它将最终以有趣的方式改变我们所做的每一个产品。我的意思是,我亲历了这一切的发展。
你可以看看我们已有的主要产品,比如 Facebook 和 Instagram 的动态和推荐系统。我们一直在不断地发展这些产品,它们已经从最初的与朋友联系功能发展到了更多。
排名功能一直非常重要,因为即使你只是关注朋友,如果有人分享了重要事件,比如你的表弟生了孩子,你当然希望这个消息能出现在动态的最上方。如果我们没有把它突出显示,而是让它埋没在动态中,你可能会对我们感到非常不满。
排名功能一直很重要,但在过去几年中,它已经发展到了一个新的阶段,越来越多的内容变成了各种公共内容。
推荐系统因此变得至关重要,因为现在面对的不再是几百或几千个来自朋友的潜在帖子,而是数百万个内容片段,这构成了一个极具挑战性的推荐问题。
随着生成式 AI 技术的进步,我相信我们很快就会进入一个新的阶段,届时 Instagram 上推荐给你的大部分内容将不仅仅是基于你关注的人,而是来自世界各地与你的兴趣相匹配的内容。未来,大量内容也将通过这些工具被创造出来。其中一部分将是由创作者使用这些工具创作的新内容。
我认为,其中一部分内容最终将根据你的需求即时生成,或者是通过整合全球各地的不同资源来创造的。这正是我们核心业务将如何演变的一个例证。实际上,这种演变已经持续了 20 年。
黄仁勋 :然而,我认为很少有人意识到, 推荐系统是世界上设计出的最大计算系统之一。
扎克伯格 :确实,这是一个全新的方向,不是吗?它并不是人们热议的生成式 AI 领域,但我认为它就像是一种架构,所有的转换都是架构。这就像是在构建越来越通用的模型,将非结构化数据转化为有用的特征。
确实,推动质量提升的一个关键因素是,过去我们为每种内容类型都设计了不同的模型。
例如,我们曾有一个模型专门用于短视频的排名和推荐,另一个模型则用于长视频。通过产品开发,我们使得系统能够在线显示任何类型的内容。
随着你创建出能够覆盖所有内容的通用推荐模型,这些模型会变得越来越精准。我认为,这部分是因为内容的流动性,就像经济学中的概念,你从一个更广泛的内容池中提取,这样就避免了从不同池子中提取内容时可能出现的效率低下问题。
确实,随着模型变得越来越强大和通用,它们的性能也会不断提升。
我梦想着有一天,Facebook 或 Instagram 几乎可以由一个单一的 AI 模型驱动,这个模型能够整合不同的内容类型和系统,这些系统在不同的时间尺度上有着各自的目标。有些内容是向你展示今天你可能感兴趣的有趣内容,而有些则是长期帮助你扩展社交网络,你可能认识的人或你可能想关注的账户。
黄仁勋:多模态模型通常在识别模式和微弱信号方面表现更出色。人们总是对 AI 在你公司中的深度应用感到好奇,毕竟你们一直在构建 GPU 基础设施,并且运行这些大型推荐系统已经有一段时间了。
扎克伯格:实际上,你在采用 GPU 技术方面确实有些滞后。
黄仁勋:是的,我几乎是刻意想要表现得友好一些。
扎克伯格:我知道,可能表现得太过友好了。
黄仁勋:我确实试图表现得友好,你知道吗,我在上台前在后台准备时。
扎克伯格:你之前在谈论关于承认错误的事情,对吧?
黄仁勋:你不必无缘无故地自己提出来。
扎克伯格:我想这个话题已经被充分讨论过了。感觉就像我刚刚被狠狠地批评了一顿。
黄仁勋:现在,生成式 AI 真正酷的地方在于,当我使用 WhatsApp 时,我感觉我正在与它合作。我喜欢想象,当我打字时,它正在实时生成图像。我回头修改我的文字,它就会生成不同的图像,你知道吗?
所以那个中国老人在日落时,一边品着威士忌,一边被三只狗围绕着,一只是金毛猎犬,一只是金毛混血犬,还有一只是伯恩山犬。
它生成了非常吸引人的一张图片。是的,我们已经做到了,那是我每个月的样子。确实,这更好了。现在你实际上可以在那里上传我的照片。这是真的我吗?
扎克伯格:是,这听起来像是上周的事。
黄仁勋:是的,我对此非常兴奋。
扎克伯格:想象一下,我花了很多时间与我的女儿们一起玩耍,想象她们变成美人鱼等角色,过去的一周真是乐趣无穷。是的,这就是生成式 AI 的另一面。一方面,我认为它将为我们的工作流程和产品带来一次重大升级。但另一方面,它还将催生出许多全新的创意。
因此,Meta AI 的概念是拥有一个能够帮助处理各种任务的 AI 助手,这将是极具创造性的,正如你所描述的那样。但重要的是,它们非常通用,因此不必局限于特定用途。随着时间的推移,它将能够回答任何问题。
当我们从 Llama 3 类模型过渡到 Llama 4 类模型及其更高级版本时,这种体验将不再局限于简单的聊天机器人模式。不再是你给出提示,它就回应,然后你再给出提示,它再回应。
相反,它将迅速发展,能够根据你的意图独立工作,跨越多个时间框架。我的意思是,它应该从一开始就确认你已经向它表达了你的意图。
但我的意思是,我认为有些东西最终会加速计算工作,需要几周或几个月的时间,比如,当世界上发生了一些重大事件时。我认为这将具有非常强大的力量。
AI Studio 将帮助每个创作者构建一个 AI 版本的自己
黄仁勋:因此, 今天的 AI 主要功能是接收输入并做出回应。但当我们面对一个任务或问题时,我们通常会考虑多个选项,甚至可能构建一个决策树来考虑每种可能的选择所带来的不同结果。这就是我们在进行规划的过程。未来的 AI 也将执行类似的操作。
当我听到你阐述关于创作者 AI 的愿景时,我感到非常兴奋。这个想法确实令人振奋。请向大家介绍一下创作者 AI 以及这个 AI 工作室,它将如何帮助大家实现这一目标。
扎克伯格:确实,我们之前提到过,但今天我们正在将这个项目扩展到更广泛的范围。我们的愿景是,不会只有一个 AI 模型。有些公司似乎在构建一个中央代理,但我们会提供一个 Meta AI 助手供大家使用。更重要的是,我们希望赋予所有使用我们产品的人创建自己代理的能力。
因此,无论是平台上的众多创作者,还是数以亿计的小企业,我们最终希望能够整合所有内容,并迅速创建一个业务代理,以便与你的客户互动,进行销售和客户支持等。我们现在开始推广的项目被称为 AI Studio。
基本上,AI Studio 是一套工具,最终将帮助每个创作者构建一个 AI 版本的自己,作为社区可以与之互动的代理或助手。这里有一个基本问题:一天的时间有限。
如果你是一名创作者,你希望与社区有更多互动,但时间是个限制。同样,你的社区也希望与你互动,但这同样困难,因为时间有限。
因此,允许人们创建这些 AI 代理,实际上是一种替代方案。这些 AI 代理虽然不是创作者本人,但你可以训练它们以你想要的方式代表你,就像创作艺术作品或发布内容一样具有创造性。
显然,这些代理不是直接与创作者本人互动,但我认为这是创作者在社交平台上发布内容后,以另一种有趣的方式与观众互动的一种方式。
同样,我相信人们将根据自己的需求和偏好创建各种用途的 AI 代理。有些可能是为了完成特定任务而设计的定制化实用工具,他们希望对其进行微调。还有些代理可能是为了娱乐目的而创建的。
有些人们创造的内容非常有趣,甚至有些荒谬,以各种不同的方式展现出来,或者对某些事情持有一种幽默的态度。这些内容可能不会被整合进 Meta AI 作为一个助手功能,但我认为人们对于看到和与这些内容互动非常感兴趣。另一个有趣的应用场景是,我们看到人们开始利用这些代理来获取帮助。
让我有些意外的是, Meta AI 目前一个非常受欢迎的应用场景是人们用它来模拟即将面临的复杂社交情境。
例如,在职场中:我想问我的经理,如何才能获得晋升或加薪?或者我与朋友发生了争执,再或者我和女朋友之间出现了棘手的问题。这样的对话该如何展开?
这个平台提供了一个完全无压力的环境,你可以在这里模拟不同的对话场景,观察对话的进展,并获得有益的反馈。
然而,许多人并不满足于只与单一类型的 AI 代理互动,无论是 Meta AI、ChatGPT 还是其他流行的选择。他们渴望创造属于自己的内容。这就是我们 AI Studio 的发展方向。
这一切都是我们更大愿景的一部分,我们认为,人们不应该只与一个大型 AI 进行互动。我们相信,如果世界上存在更多这样多样化的内容,世界将变得更加美好和有趣。
黄仁勋:我认为这非常酷,如果你是一名艺术家并且拥有自己的风格,你可以将这种风格和你所有的作品集,微调成 AI 模型。现在,你可以向这个模型提出请求,让它根据你的艺术风格来创作。
你甚至可以提供一件艺术品,如一幅画或一个草图,作为灵感。我可以为你生成作品。你可以通过我的 AI 来获取这样的服务。
未来,每家餐厅、每个网站可能都会有这样的 AI。
扎克伯格:是的,我认为在不久的将来,就像现在每个企业都有一个电子邮件地址、网站和社交媒体账户一样,未来每个企业都会有一个 AI 代理来与客户互动。
历史上,一些事情一直很难实现。例如,考虑任何一家公司,客户支持通常是与销售分开的部门。这并不是作为 CEO 希望看到的工作方式,因为这两者需要不同的技能。
黄仁勋:你正在构建这些,你的客户支持似乎是关于,是的,显然我是。我的意思是,我记得作为 CEO 的 Mark 需要一些东西。我无法确定是什么,但他似乎并不是一个聊天机器人。
扎克伯格:不,嗯,我想这有点像是,是的。作为 CEO,你必须处理各种事务。但我的意思是,当你在组织中构建起这种抽象概念时,很多时候,像你这样的组织是分开的,因为它们各自优化了不同的事情。但理想的状况是,这些事情应该是一体的。作为客户,你其实并不关心这些。
无论是购买商品还是处理购买后的问题,你都不希望遇到不同的处理方式。你只希望有一个地方可以解答你的疑问,并以不同的方式与企业互动。我认为这也适用于客户服务。
与客户的每一次互动,尤其是他们的投诉,都有助于提升公司的品质。
黄仁勋:是的,你说得对。通过与这个 AI 的互动,我们可以捕捉到组织内的知识。这些互动数据可以用于分析,从而提升我们的服务等方面。
扎克伯格:是的,我认为这个业务版本在集成方面做得更多,我们目前还处于早期的测试阶段。但是 AI Studio 让用户能够创建自己的用户生成内容(UGC)代理和其他相关功能,并启动创作者创造它们的良性循环。我对这个项目感到非常兴奋。
黄仁勋:所以,我能否使用 AI Studio 来优化我的图片,我的图片集?
扎克伯格:是的,我们将会实现这个功能。
黄仁勋 :然后我可以把我写过的所有内容都加载进去,基本上把它当作我的个人助理,好吗?每次我回来时,它都会重新加载记忆,记得我们上次对话停在哪里。然后我们可以继续对话,就像之前从未中断过一样。
扎克伯格:是的,你看,我的意思是,就像所有产品一样,它会随着时间的推移而不断改进。训练工具也会变得更好。这不仅仅是你想要它说什么。通常,创作者和企业都有他们想要避免的话题,我们在这方面会不断进步。
你知道,我认为理想的状况不仅仅是文本,对吧?你几乎希望能够做到更多。这有点像是与你正在进行的柯达头像工作的交叉。你基本上希望能够与代理进行几乎像是视频聊天一样的互动。
我相信我们很快就能实现这一目标。这些技术并不遥远,而且发展速度非常快,这让人感到非常兴奋。有很多新的内容等待我们去创造。
即使基础模型的进步现在停止了,但我认为这不会发生,我们仍然有大约五年的时间来进行产品创新,让整个行业学会如何有效地利用已经开发出的所有技术。
但实际上,我认为基础模型和基础研究的进展正在加速,现在是一个非常激动人心的时期。你的愿景,你知道,这一切,你都已经实现了吗?
黄仁勋 :所以,感谢你在上一次对话中的支持。是的,你知道,作为 CEO,我们有时候会感到脆弱,我们需要很多鼓励和支持。
扎克伯格:我们现在已经相当坚韧了。我认为我们是这个行业中资历最深的两位创始人,对吧?这是事实。
黄仁勋:的确如此,的确如此。
扎克伯格:我只是注意到,你的头发已经变灰了,而我的只是变长了。
黄仁勋:我的头发变灰了,而你的变卷了,这是怎么回事?