元宇宙绝不是一个地儿那么简单,
它是一种通信媒介。
我们用来描述新技术的隐喻限制了我们对它的思考方式,就像面对一张过时的地图,经常使我们误入歧途。元宇宙也是如此。有些人似乎将其视为一种特别的房地产,包括跑马圈地和努力为创造的任何虚拟财产带来流量都是这种理念的体现。
从房地产隐喻的角度来看,元宇宙不仅成为游戏 Second Life 的自然继承者,而且成为万维网和社交媒体源的自然继承者,所有人都将其视为一组可供访问的地方(站点)。在我们想象中,虚拟现实设备将使这些“地方”更加身临其境。
但是,如果我们不把元宇宙视为一组相互连接的虚拟场所,而是将其视为一种交流媒介,会怎么样?在这个前提下,我们将元宇宙视为一条线的延续,通过消息传递和电子邮件把它传递到“集合”型社交应用程序,如 Zoom、Google Meet、Microsoft Teams,以及用于广泛广播的 Twitch + Discord。这是从文本到图像再到视频,从存储、转发到实时(以及对于广播来说,”存储的时间”,这是一种对录制的视频进行思考的有用方式),但在每一种情况下,互动都不是基于地点的,而是发生在两个或更多连接的人之间的。互动场景比互动地点更重要。
在接受 Lex Fridman 的采访时,马克·扎克伯格否认了将元宇宙视为一个地方的概念,他以一种非常基于地方的方式描述了它的未来:
很多人认为元宇宙是关于一个地方的,但我对此的一个定义是,基本上沉浸式数字世界会成为我们生活和消磨时间的主要方式。
想一想,如果我们把扎克伯格的陈述更进一步:
很多人认为元宇宙是关于一个地方的,但我对此的一个定义是,沉浸式数字世界成为我们交流和分享数字体验的主要方式。
是不是更清楚了。
我个人的元宇宙的体验时刻根本不关VR什么事儿,而是 Zoom。我和我太太 Jen 每个工作日早上都会和我们的朋友 Sabrina 在 Zoom 上一起锻炼。Sabrina 通过分享她的 Peloton 应用程序来主导课程,其中包括直播和录制的锻炼视频。我们最喜欢的是Rad Lopez的力量训练视频和Robin Arzón的 15 分钟腹肌训练视频。我们通常以 Rad 开始,以 Robin 结束,进行 45 分钟的高强度锻炼。
在这个过程中:Jen 和我的物理地点在家里。Sabrina 在她自己家里。Rad 和 Robin 在城市另一端的工作室录制了他们的视频。Jen、Sabrina 和我却又实时的在“同一现场”。Rad 和 Robin 在存储的时间里。我们将处于四个不同坐标、三个不同时间流的五个人加入到一个连接的时刻和一个连接的地方,也就是存在在参与者之间的“地方”。
Sabrina 还使用 Peloton 应用程序搞自行车锻炼,这也具有这种共同的特质,多个参与者处于不同的连接“厚度”。不论是当 Jen、Sabrina 和我正在使用实时 Zoom 视频“增强”共享时,还是 Sabrina 的“单人”自行车锻炼使用 Peloton 应用程序中的内在共享时,都可以让参与者可以看到其他人的实时统计数据。
这就是真正的互联网——网络联通网络,动态互连。如果元宇宙要继承这一互联网的衣钵,它必须具有同样的品质:连接。
Hacker News 用户kibwen在写道:
元宇宙涉及某种共享空间和跨网络媒体的共享体验。它绝不是仅仅是在 VR 中做什么那么简单,而且元宇宙甚至都不需要 VR。
把技术趋势(走向未来的技术发展路线和对过去的继承)看成是向量是很有用的,这些向量只能用大小和方向来完全描述,而且可以加总或乘以获得它们如何抵消、放大或重定向可能的未来路径的感觉。
早在 2020 年,我在一篇名为《欢迎来到 21 世纪》的文章中就使用场景规划来想象新冠疫情结束后的未来时,就写下了这个想法。值得在这里回顾一下:
一旦你释放了你的想象力,观察你周围的世界,并注意场景规划者有时称之为“来自未来的信息”——这些数据点告诉你世界正朝着你想象中的或另一个场景的方向发展. 与任何散点图一样,数据点遍布整个地图,但是当你收集到足够多的数据点时,你会开始看到趋势线出现……
如果将趋势视为向量,则新数据点可以被视为扩展和加粗的趋势线,并直接体现它们是加速还是减速。当看到趋势线如何相互影响,或者如何需要添加新的趋势线时,你可以不断更新场景(或者正如那些熟悉贝叶斯统计的人所说,你可以修改你的先验)。这可能是一个相对无意识的过程。一旦你建立了世界的心智模型,你阅读的消息就会到位,加强或摧毁你想象的未来。
以下是我对元宇宙的想法是如何由围绕技术发展向量的“来自未来的新闻”形成的:
早在几十年前,我就有一个先前的信念,即互联网是一种连接和交流的工具,沿着这个方向前进将很重要。我一直在寻找证据,证明连接和交流的工具变得越来越丰富,试图了解它们如何变得更丰富以及它们如何改变社会。
多年来,我一直在研究 VR,尝试了各种头显和体验,但它们大多是单独的,感觉更像是独立游戏,要不就是共享的很尴尬和低龄卡通化。然后我读了我的朋友 Craig Mod 的一篇很有深度的文章,他在其中指出,虽然他的身体生活在日本的一个小镇或走在古老的人行道上,但他也有一种工作生活状态,他每天都花时间与世界各地的人打交道。我确信,他与元宇宙建立了明确的联系,但我们都找不到根植于这种想法的作品来证实这一点。无论如何, Craig 与世界的的通讯是我认为的“元宇宙是互联网通信技术的延续”的概念的体现。
当朋友们开始使用有趣的背景时,我开始看到我与 Zoom 的联系,其中一些背景板是虚拟的,而另一些背景板则明确了他们在哪里。(例如,我的朋友 Hermann 使用他在新西兰家后面的海滩作为背景,这比他的家庭办公室的背景更生动地体现了他所在的地点,他的家庭办公室可能在任何地方。)这使我与Jen、Sabrina 的锻炼健身的故事成为这个不断发展的故事的一部分焦点。
我与Phil Libin谈到了他出色的服务mmhmm,mmhmm 使得通过 Zoom 和类似应用程序创建和交付更丰富、更具交互性的演示文稿变得容易。从字面上就能看出来,演讲者占据了演讲的空间。Phil 关于“ The Out of Office World ”的演讲让大家大呼过瘾。他谈到了通信的层次结构和调节工具。(依我之见对于任何思考互联网应用程序的未来的人来说,这是一部必看的作品。但是看过的人似乎不多。)
5.使用Meta Quest 2尝试游戏《超自然现象》,完成了我与朋友使用 Zoom 和 Peloton 健身的经验与 VR 主导的 metaverse 框架之间的联系。在这里,我站在埃塞俄比亚Erta Ale的一个熔岩湖的边缘,这是一座惊人的火山,就像《指环王》中的厄运山一样,在进入拳击训练游戏之前,通过健身教练的视频绿幕来进行热身运动。Susie 教练就像 Robin 和 Rad一样,在储存的时间内出现。所缺少的只是Jen 和 Sabrina.。我相信,这种在非凡场所的共享体验是未来VR的重要组成部分。
在该视频中,扎克伯格展示了装饰华丽的个人空间、逼真的卡通头像,以及被实时视频通话打断的在线会议。他说:
还有一段路要走,但你可以看到一些基本构件的雏形。首先是临场感。这是元宇宙的决定性品质。你会真的觉得你和其他人在一起。你会真切的看到他们的面部表情,你会真切的看到他们的肢体语言,也许你会知道他们是否真的握着一只胜利的手——所有这些微妙的沟通方式,都是今天的技术所不能提供的。
我完全同意临场感就是核心的想法。但 Meta 的愿景似乎在它对化身的过分关注上落空了。与那些学习创建模仿我们的肢体语言和表情的化身相比,嵌入式视频提供了更多的临场感,而不需要用户做出多少努力。
克里斯·米尔克(Chris Milk),创造 Supernatural 的公司 Within 的首席执行官,在几个月前的电话交谈中向我聊起公司的起源故事时,对小扎的化身概念表达了赞同也表达了异议:
我们很早就了解到,在建立存在感和人类联系方面,逼真度非常重要。使用逼真的方法(如沉浸式视频)拍摄的人类,可以让观众和沉浸式VR体验中记录的人之间有更深的联系。观众感觉和他们一起存在于故事中。但从技术角度来说,这是很难做到的,你会放弃一堆其他的东西。权衡之下,你可以有逼真的效果,但要牺牲互动性,因为逼真的人类需要预先录制。或者,你可以有很多互动性和人与人之间的交流,但你放弃了人的真实性。在后者中,人类需要是实时渲染的化身,而那些化身目前看起来并不像真正的人类。
与此同时,Milk 指出,人类甚至可以从粗糙的化身中读取很多内容,尤其是当它们伴随着使用语音的实时通信时。
特别是如果它是你已经认识的人,那么人际关系可以克服很多缺失的视觉真实感。我们曾经在 2014 年或 2015 年做过一个实验。Aaron [Koblin,Within 的联合创始人] 住在旧金山,而我在洛杉矶。我们已经建立了一个 VR 原型,每个人都有一个头盔和两个手柄,表现就是三个立方体的块儿。我在洛杉矶戴上头盔,视野中,Aaron 的形象“积木”坐在我对面的地板上——当时他在旧金山,他的头盔和手柄放的地板上。突然,当他拿起头盔戴上时,三个积木从地上跳到了空中。悬浮的方块 “走 “到我面前,挥了挥手,说,”嘿”。随即,在我还没有听到声音的时候,我就认出了这些方块中的人是 Aaron 。我通过姿势和步态认出了这三个在空间中移动的立方体中就是 Aaron 的灵魂。分辨率底下到任何一丝逼真度都完全没有,但人性仍然显示出来。当他的声音从耳机中传出时,我的大脑完全接受了Aaron 的灵魂现在就寄居在这三个漂浮的立方体中。来回交流中没有任何尴尬的地方。我的大脑瞬间就接受了这种设定。
让我们回到向量的概念。虚拟现实中真实感的未来取决于人工智能的发展速度和方向。在许多方面,逼真的头像是一种深度伪装(deepfake),我们知道这种深度伪装的创作是多么昂贵。需要多长时间才能创建足够便宜和足够快的深度伪造品,以使数亿人可以实时创建和使用它们?我怀疑这可能需要很长的很长的一段时间。
话说回来,使用当今的技术,视频和虚拟作品已经融合非常好。具有讽刺意味的是,在 Meta 关于未来的视频中,视频只是显示在虚拟空间的屏幕上,而不是它的一个组成部分。Meta 可以向 mmhmm 学到很多东西。
另一方面,创建一个巨大的沉浸式 3D 静态图像库,其中可以插入化身或绿屏视频图像,似乎更接近于实现的方案。这仍然很难,但困难要小几个数量级。由 Supernatural 和其他 VR 开发者提供的虚拟空间让人们对这方面的可能性有了惊人的体验。
在这方面,一个有趣的佐证来自我们今年早些时候在 Social Science Foo Camp(O’Reilly、Meta 和 Sage 每年举办的活动)使用ENGAGE虚拟媒体会议应用程序举行的虚拟会议。一开始,该小组在默认的会议空间,但其中一位与会者 Adam Flaherty 建议他们将会议场景换一个更合适的地方。他们“搬到了”牛津大学博德利图书馆的精美渲染版本的会议室,与会者报告说整个谈话的基调都随着这种变化而发生了变化。
另外两个值得思考的领域:
社交媒体从一个用于实时交互(实时状态更新、论坛、对话和群组)的平台演变为一个通常以存储时间交互(帖子、故事、卷轴等)为主的平台。存储时间通信格式的创新是未来社交媒体竞争的核心,看看 TikTok 就是对Facebook的一个活生生的强烈提醒。随着元宇宙的展开,开发人员和影响者会有一个真正的机会来开拓新的格式。
就像在当今的游戏环境中一样,机器人很可能在元宇宙中发挥重要作用。我们能区分机器人和人类吗?Chris Hecker)的独立游戏《SpyParty》(原型制作于2009年)将此作为游戏的核心特征,要求两名人类玩家(一名间谍和一名狙击手)在挤满了机器人(游戏开发者称之为非玩家角色或NPC)的聚会中寻找或躲避对方。机器人和假人已经在改变我们在互联网上的社交体验;预计这种情况将在元空间中以立体的方式发生。一些机器人将是有帮助的,但其他机器人将是恶意的和破坏性的。我们将需要区分这些机器人。
将交流作为元宇宙故事的核心提醒我们一件事:交流首先取决于互操作性。一个由几个大的供应商参与赢家通吃的竞争来创建Meta或苹果或其他什么公司的元宇宙,将比一个允许开发者创造伟大的环境和体验并将它们与其他人的创新一点一点地连接起来的元空间要花费更长的时间。如果元宇宙是互联网(”网络的网络”)的延伸,而不是试图用一个有围墙的花园来取代它,那会好得多。
一些可以互操作的东西会很棒:
身份。我们应该能够跨平台、应用程序和不同公司提供的场所,都能使用代表我们身份的数字资产。
传感器。智能手表、戒指等越来越多地用于收集生物数据信号。这项技术可以内置到 VR 专用头盔中,但如果它可以在不同供应商的设备之间轻松共享,我们会做得更好。
地点。(是的,地点毕竟是其中的一部分。)与其让一个提供者(比如 Meta)成为逼真的 360 度沉浸式空间的大仓库,不如拥有一个允许它们重用的互操作层。
机器人识别。NFT 是否最终会成为不可否认的身份形式(区分人类和机器人)的基础?(我怀疑如果我们可能不能要求人类都这样做,我们只能强制机器人识别自己。)
让我们继续畅想,将元宇宙视为来自不同方向的、以不同速度前进的多个技术趋势向量的组合,并相应地推动整个向量向前(或向后)。没有任何新技术是单一载体的产物。
因此,与其只停留在“元宇宙是一种通信媒介”,不如考虑一下除了实时通信之外的各种技术载体,如果这些技术载体在当前时刻汇聚在一起。我们可能会获得来自未来的什么消息?
虚拟现实/增强现实。更轻、更不突兀的耳机。3D 视频录制的进展。传感器的进步,包括眼动追踪、表情识别、生理监测,甚至大脑控制接口。AR和VR之间平衡的创业创新。(它们应该是互相关联的而不是相互排斥的。)
社交媒体。KOL影响者和粉丝之间联系的创新。存储的时间如何变得更加实时?
博彩。游戏和通信之间更丰富的集成。下一个 Twitch + Discord 是什么?
人工智能。不仅仅是深度伪造,还有人工智能和机器人作为社交媒体和其他通信的参与者的扩散。NPC 成为我们在游戏之外的在线体验的常规部分。在线社区中识别机器人与人类的标准。
加密货币和“Web3”。 加密/Web3 是否为元宇宙提供了新的商业模式?(顺便说一句,我喜欢Reamde中的 Neal Stephenson 在设计其他任何东西之前让他的角色为他的在线游戏设计商业模式和资金流的方式。许多初创公司只是试图吸引用户并假设商业模式会随之而来,但是这使我们走入了广告和监视资本主义的死胡同。)
身份。当今的大多数身份系统都以一种或另一种方式集中,其身份由受信任的提供者或验证者提供。然而,Web3 的支持者正在探索各种去中性化的“自我主权身份”系统,包括 V神 的“灵魂绑定NFT”。在没有可验证身份的情况下,加密系统易受Sybil 攻击的脆弱性正在推动身份空间的大量创新。Molly White对这些不同举措的怀疑调查报告很好地概述了问题和克服它的难度。Gordon Brander 的“ Soulbinding Like A State ”,对 Molly White 的帖子和 James C. Scott 的Seeing Like A State的即兴演奏,提供了进一步的警告:“Scott 的框架表明……易读性的危险与身份证明的主权无关。自我主权有价值的原因有很多,但自我主权身份的功能仍然是使持有者清晰易读的第一价值。被测试的东西得到管理。可读的东西得到控制。” 通常情况下,不会找到完美的解决方案,但社会会通过权衡取舍来采用不完美的解决方案,这种取舍对某些人来说是糟糕的,对另一些人来说是非常有利可图的,而广大用户将被动接受。
有其他看法欢迎你留言。
作者:蒂姆-奥莱利(Tim O’Reilly)在召集重塑计算机行业的对话方面有一段历史。如果你听说过 “开源软件”、”网络2.0″、”创客运动”、”政府作为一个平台 “或 “WTF经济 “等术语,他曾参与了这些大概念的构建。他是O’Reilly Media的创始人、CEO和主席,也是早期风险投资公司O’Reilly AlphaTech Ventures(OATV)的合伙人。他也是Code for America、PeerJ、Civis Analytics和PopVox的董事会成员。他的书《WTF: What’s the Future and Why It’s Up to Us》由哈珀柯林斯出版社于2017年10月发行。他是伦敦大学学院创新和公共目的研究所的实践访问教授,他正在研究一种新的方法,通过限制他们提取经济租金的能力来监管大技术平台。