明敏 克雷西 发自 凹非寺
传言为真,Sora开放!
OpenAI“双十二”第三天,更重磅炸弹来袭——
只要是ChatGPT Plus/Pro用户,就能直接用Sora生成视频。
场面有多火爆呢?
大家已经把服务器冲爆了。
△这盛世如奥特曼所愿
它最高上限支持生成1080p、20秒视频,支持横屏竖屏各种常见尺寸。
OpenAI表示,从今年2月开始Sora初登场后,他们就开始开发Sora Turbo,也就是当下开放的这个版本。
它比2月份的版本,快得多。
曾经的咖啡小船儿已经大变样。
来看科技博主MKBHD放出的实测效果:
Sora Turbo生成地标建筑物已是手拿把掐。高分辨率视频的效果令人印象深刻。
一些非写实的镜头表现也很nice。
OpenAI说,这是给大家准备的(圣诞)节日礼物。
不过,这个礼物还是需要大家自掏腰包享受。
Plus会员(每月20刀)和Pro会员(每月200刀)的权益不一样。
具体来看,Plus会员每月最多可生成50支视频,720p分辨率最多生成5秒,480p分辨率可以生成10s。
Pro会员每月可生成5000支视频,支持1080p、20s、并发5代,还支持无水印下载。
已进行中文提示词实测
进入Sora的界面,就会看到一些已经生成好的案例,而界面下方就是提示词输入框了。
还可以点输入框左下角的加号上传图像或视频,实现图/视频生视频。
加号右侧的按钮,是Sora事先准备的一些预设风格,部分风格效果如下:
再往右,依次是画幅比例、画质、时长和数量,Sora支持横屏(16:9)、正方形(1:1)和竖屏(9:16)三种尺寸。
当配置选定后,鼠标划过问号的区域时,会显示生成视频所需消耗的点数。
除了简单的一段话prompt,Sora还支持故事板(Storyboard)模式,可以给视频添加多个分镜头。
和直接生成一样,分镜头的控制方式既可以是文本,也可以是图片或已有的视频。
如果不会写提示词,可以先描述大致内容,然后一键让系统帮忙改写扩展,甚至可以直接写中文。
不过实测发现,即使用简单提示词直接生成,系统也会自动生成分镜,并对提示词进行拓展。
经过漫长的等待(不过大部分的时间其实是在排队),我们的视频终于生成好了。
如果想要对生成的视频进行修改,只需要利用Sora的Remix功能,描述想要修改的内容,不用另起炉灶重新写一遍完整的提示词。
比如这样一段打开图书馆大门的视频,可以通过修改指令变换门的风格,把图书馆变成飞船、丛林、月球……
或者视频当中只有一小段满意,可以用Re-Cut功能截取出来,然后向前或向后延展。
对于特定场景,可以用循环(Loop)功能创造出首尾无缝衔接的循环视频。
此外,Sora还提供了混合(Blend)功能,可以把两段视频融合在一起。
第一段视频是冬天雪花飘落的场景:
第二段则是春天花朵在风中起舞:
经过Sora这个“大裁缝”的缝合之后,画面中下落的物体从雪花逐渐变成彩色的花瓣,背景色也从冷变暖。
顺便一提,OpenAI专门强调了防止Sora被滥用的问题。
生成的视频都带有C2PA元数据,方便溯源。同时生成视频也默认带官方水印(Pro用户可以关)。
理解物理还是不够好
在发布之前,一些博主拿到了Sora Turbo抢先体验的名额。
Marques Brownlee第一时间分享了自己测评一周的效果。
从实测来看,Sora Turbo依旧有一些弊端。
首先,对物理规律的理解还是不够好。
比如奔跑的犀牛会突然飞起来。
人物的手部动作也不够自然。
往好处想,生成对物理规律理解要求不那么高的定格动画,效果就还可以接受。
其次,视频中文字乱码的情况依然存在。不过这些镜头剪辑都是由Sora完成。
以及图片生成视频功能中,Sora可以理解图片的内容。
But,它对于静态动作应该有的运动方向和速度理解还是不到位。
当然最后有一个关键问题——Sora似乎没给团队用户开放?
这部分OpenAI已经有官方解释。
团队用户、企业用户以及教育用户都不支持。18岁以下用户也不能用Sora。
未来几个月,Sora会逐步开放到欧洲等地区。
One More Thing
值得一提的是,Sora提供了社区功能。
现在,从Explore的Recent中就能看到用户最新生成的内容。
可以再创作、或搜索相似的视频,原来Sora完全体是AI版抖音。