Sora继续成为人工智能的热点。
最近两天,因为有媒体曝出谷歌用大模型训练生成的物理实验模型,相关论文登在了《自然》之上,引发一堆物理学家的争议。
这是由于谷歌的这个模型是可以在材料学领域虚拟进行实验,并寻找材料配方的合适配比。虽然大大节省了科研人员的时间,但却让很多科学家因为无法复现谷歌训练的过程,而感到苦恼。
同时国内接触过OpenAI和Sora的大模型专家也指出,实际上OpenAI开发的Sora是对物理世界的真实理解,有可能将来成熟后承担更多的科研工作。
因此,这一波热潮主要从“是否我们将面临人工智能全面进驻的世界”这个问题引发。
但其实,绝大多数哄吵这个话题的媒体、自媒体以及受众,实际上都没意识到,这个文生视频进而引发人工智能对真实世界理解能力探索的Sora,未来可能只有在中国才能真正变成现实。
原因也很简单。
科学家们推算发现,目前美国基础设施的缺乏和电力系统的老旧,无法支撑这样一个超乎想象的大模型运营。
一切都要电
最近这段时间OpenAI在美国硅谷的一些杂志上,刊登了另外一个数论的论文,核心的内容是在讲如何通过数学的方式,压缩对大模型训练相关材料的数量,进而提升为大模型培训的效率。
这样的一个论文,其实里面引用的很多数据都是OpenAI在培训相关大模型过程中使用的经验,有国内顶尖的数学与大模型研究专家,特意对这个论文进行了逐字逐句的分析。
经过跟他的沟通,我大概获知,他的计算显示,实现Sora目前一分钟的视频,需要英伟达最新的B100算卡在液冷状态下发挥最顶级功能,大概8块算力显卡工作4个小时左右。
而B100的性能相当于现在普遍使用的A100相关系列算卡6-8倍。这也就意味着如果换算成现在OpenAI对外提供服务普遍使用的A100算卡,这一分钟的视频大概是60块左右A100工作4个小时的成果。
如果最终商业化,一般情况下视频生成最长的时限在半小时比较合理。这意味着需要1800块A100的算卡工作4个小时。
但商业化的过程一定要想办法压缩生成视频的时间,按照这位大神给出的数据来估算,缩短一半的时间,需要投入2.7倍的算卡。
因此,如果将生成半小时视频的算力使用时间压缩到一个小时,那也就意味着在这一个小时之内,要调取13,122块A100的算卡同时工作。
目前OpenAI的ChatGPT对外提供服务用的是将近3万块A100的算卡,也就是说现在他对外服务提供算力的水平,仅供同时有两个客户提出半小时视频生成的任务。全天24小时,只能服务最多50个客户。
而现在根据纽约时报援引对OpenAI创始人山姆.奥特曼的采访,ChatGPT每天要消耗50万度的电。
这也就意味着,换成文生视频的Sora大模型,服务一个客户就要消耗1万度的电。而一般互联网企业,提供并行服务的数量都是以十万乃至百万计。ChatGPT刚出来之时,曾经创下过并行服务700-800万用户的记录。
这意味着,如果按最少100万并行用户的规模来计算,ChatGPT真正推出Sora这个视频模型的时候,每天消耗的电量是100亿度。
这个数字大家可能没有什么印象。
我统计了下美国发电量。2020年,美国发电量4.54万亿千瓦时,也就是4.54万亿度;到了2023年,中国发电量是828980吉瓦时,也就是8.29万亿度。美国是346387吉瓦时,就是3.46万亿度,发电量呈现下降趋势。
也就是说如果OpenAI真将Sora大模型商业化,一个月光这个模型就要消耗3,000亿度的电,差不多是美国2023年全年发电量的1/11。
难怪奥特曼现在满世界找7万亿美元的投资,想方设法要OpenAI在这个大模型上跑起来。
最后是拼光伏?
最新的采访中,奥特曼也对媒体真诚地表示,他现在觉得人工智能的尽头一定是光伏和发电。
这里有一个很好玩的事。
奥特曼为什么要把光伏与发电并列?原因就在于美国,现在疯狂的在给光伏发电补贴。当然最主要是美国现在发电缺口非常大,原本的火力和核能发电厂,由于老旧逐渐会退出现在的发电市场。
而相较于火力和核能等发电厂的建设,光伏发电其实是一次投入最起码几十年都可以获取收益的过程。
关键维护的成本也比较低,再加上追求绿色能源的政治因素,光伏在美国走红就是一个很正常的事。
但可惜奥特曼不是熟知光伏产业的行业专家。
世界都知道光伏产业的产业线和相关的技术集中,绝大多数都在我们这里。原因其实特别简单,就是在2008年那一轮4万亿的刺激中,国家下决心把光伏列为了重点支持和补贴的对象。
10年之前中国的光伏发电成本还居高不下,单度电的发电成本都能过了5毛钱。那时候国家给予的补贴绝大多数都在电价上,对于光伏发电的采购采用了一个高电价的行为支持。
这极大刺激了中国光伏发电市场的扩张。
而跟随着中国光伏发电市场的扩张,进而带来的是整个产业的飞速发展以及竞争的极具激烈。同时由于中国内卷的市场带来技术的革新,使中国光伏的产业迅速在世界上站稳脚跟。
于是到了三年前,中国光伏发电成本已经降到了1毛5以下,国家也退出了对光伏发电的补贴。而所有自行安装光伏发电并并网售电的分布式和集中式光伏发电站,也都纷纷开始盈利。
这意味着中国彻底打通了光伏发电的产业链和最终能源转化的各个细节。
曾有一段时间,由于光伏发电和风力发电的不稳定,西部大量的风能电与光伏电被浪费。经过紧急的研讨,用了两年时间,国家找到了解决方式,就是在光伏与风能集中的发电地域,构建大型储能中心。
这是由国家引领投资,地方和企业积极参与的建设项目,属于基础设施。风能和光伏由于受日照风速等影响,带来的电压不稳,在经过储能设备的周转循环之后,统一电压向外输出。
这彻底解决了绿电并网的世界级难题。
所以现在美国在疯狂的补贴太阳能发电站的建设和太阳能板的安装,仅相当于我们在2008年干的事情。接下来美国还会遇到这种太阳能光伏发电难以并网并难以被使用的难题。这种事情需要大规模储能中心的建设。
问题是,美国本土其实没有大规模储能电池的生产能力。甚至连车载电池的生产能力都没有,别看特斯拉说的1680,目前它的量产还遥遥无期。大规模采用的,依然是从中国伙伴手上获取的技术和产品。
即使美国加大光伏的投入和扶持力度,最起码在很长一段时间,在美国发电市场上光伏不可能成为主流。这也让奥特曼现在给OpenAI设定的下一步发展解决方案,出现重大的纰漏。
基础设施谁怕谁
实际上大型的算力中心建设是所有推动AI以及大模型不断前进的基础,而大型的算力中心背后一定是庞大的电力设施,发电,输电、变电等等基础能力的支持。
这相当于将看似最高精尖的大模型竞争纳入到基础设施竞争的比拼中。
而作为基建狂魔的我们,遇到基础设施竞争的时候,从来不怕。甚至我们还很庆幸,这又变成了中国人最擅长的领域。
很长一段时间,大家都没有意识到,我们的电力系统在最近10年经历了翻天覆地的变化。
一方面,超高压输电的技术落地,让西电东送损耗降低,成为了可能。现在很少听到东南沿海城市因为电力供应不足而频繁限电,甚至工业用电要让位给居民用电的新闻。超高压输电技术,在此居功甚伟。
关键这是中国独自享有的技术,国外根本就没有相似技术的研发成功。
另一方面,智能化在电力系统的落地是所有人都想象不到的。在这几年我们大模型和AI落地最核心的领域就有电力。
之前有媒体报道,我们西部含内蒙的绿色发电量就已经赶上了1/3美国全年的发电量。而这中间确实离不开大模型和AI能力的调度,毕竟绿电的不稳定和储能的使用时效都是需要有一个精密的系统来协调,最终才能达到所有人都满意的效果。
目前我们整个电力系统的稳定性以及技术的含量不是其他国家可以比拟的。而在这样一个基础设施的支持下,任何变成基础设施领域的努力都会得到更大范围的加成。
更何况现在各地已经将建立算力中心,作为一个政府推动的项目在推进。一旦被视为基础设施,作为基建狂魔的我们对此就有了更多的想法和操作空间。
实际上未来我们算力的建设大范围超越美国,我觉得是一个可以确认的事实,只不过这个时间需要多久,还有待科学的计算。
最核心的是我们各地方政府,甚至敢在算力中心的附近,单独为他搭建独立的供电系统和发电系统。直接建一个电站也不是不可能的事情。
而这样的扶持力度确实不是美国行政体系可以做到的。
所以,如果说Sora这个大模型还有真正可以落地的空间的话,那一定不是在美国,而是在中国。
毕竟,玩基建我们怕过谁。