摘要:就在今天(12月10日)凌晨,OpenAI再次震惊世界,以一场直播宣布了正式向用户开放其人工智能视频生成模型Sora。
“正版 Sora” 震撼发布
等了将近10个月,OpenAI终于给大家带来了旗下视频生成大模型Sora的消息。
就在今天(12月10日)凌晨,OpenAI再次震惊世界,以一场直播宣布了正式向用户开放其人工智能视频生成模型Sora。
图源:直播截图
Sora直播发布会的嘉宾由OpenAI CEO山姆·奥特曼(Sam Altman)、Sora团队负责人比尔·皮布尔斯(Bill Peebles)和阿迪亚·拉梅什(Aditya Ramesh)三人组成,共进行了一场约20分钟的直播。
在这场直播中,他们不仅详细介绍了Sora的新功能,更是展示了AI技术在视频创作上的无限可能。
据直播介绍,此次推出的 Sora 不同于 2 月份的演示版本,而是更高级的新版本Sora Turbo;
该版本称较2月版本生成速度显著加快,并且可以生成最长达20秒的视频,还能提供这些视频的多种变体。
据悉,新版Sora具有替换、删除或新增元素、重新剪辑、扩展及合并视频等功能。
具体操作中,OpenAI把他们分成了多个“按钮”。
比如,Remix(重混)功能允许用户替换、删除或重构视频中的元素,为视频创作提供了更多的灵活性。
Re-cut(重新切割)功能则能够让用户找到最佳的一帧视频,并在此基础上进行延展,创造出全新的视频内容。
图源:OpenAI直播
Loop(混合)功能则可以将两个视频进行无缝合并剪辑,创造出流畅的视频过渡效果。
Storyboard(故事板剪辑)功能则允许用户精准指定每个帧的输入,为视频创作提供了更高的精确度。
而Style presets(风格预设)功能则允许用户预设视频的风格,一键生成具有特定风格的视频内容……
Sora一经发布,OpenAI的服务器瞬间就被“挤爆”,官方网站(Sora.com)甚至直接崩溃,停止一切注册登录。
而已经开始使用的网友也发现了在发布会直播结束后,Sora的视频生成速度开始明显变慢。
对此,Altman 急忙出面安抚用户:“由于需求超出预期,我们将不得不间歇性地关闭新用户注册,并且生成内容的速度会在一段时间内减慢。我们正在全力以赴!”
图源:X
回顾今年2月,OpenAI首次发布有关Sora的预告,声称Sora是一项理解和模拟现实的基础性AI技术,是开发能够与物理世界互动模型的重要一步。
然而,在早期测试中,Sora却表现出了一些明显的局限性。
例如,在物理模拟方面,模型对物体运动的理解还不够深入,常常出现动作不协调、一些物体突然消失等问题。
此外,还有信息透露在某一次测试中,Sora存在“多余肢体”的问题,生成的生物不是多一只手指就是少一只眼睛。
另一方面,此次Sora的发布可以说只是OpenAI为期12天的产品直播活动的其中一个部分。
上周,OpenAI刚推出了更昂贵的ChatGPT Pro订阅选项,可无限制访问OpenAI最强大的AI模型。
至于Sora的收费方面,官方介绍显示:即日起,Sora Turbo已向订阅OpenAI Plus和Pro的会员开放全部功能,无需额外付费。
不过,不同的会员所拥有的使用额度则不太一致。
图源:ChatGPT官网
据悉,官方页面显示,每月付费20美元的OpenAI Plus会员,单月共有50次视频生成额度(1000积分),生成的视频分辨率最高为720p,单条视频时长为5秒;
而每月付费200美元的Pro会员,单月可慢速无限次生成视频,加速生成视频500次(10000积分),并且Pro会员可同时生成5条视频,分辨率最高可达到1080p,时长则提升到20秒。
Altman自己也发文宣传:“初期Sora的使用仍然受限,ChatGPT Plus订阅用户可以每月生成50个低分辨率视频,而ChatGPT Pro订阅用户则可以无限制地‘较慢’生成高分辨率视频,以及500个快速生成的视频。”
简单来说,就是会员通用,购买了ChatGPT的会员也可以使用对应的Sora Turbo。
此外,有不少朋友可能注意到了,或许是受其他竞品的启发,此次OpenAI对Sora采用了灵活的积分制定价策略。
据了解,如果你已是 ChatGPT Plus 和 Pro 会员,那么当你需要生成一个 480p、5s 的视频只需要消耗 25 个积分;
生成 480p、20s 的视频则需要 150 个积分;
生成所需积分 | 图源:ChatGPT官网
此外,当你使用Re-cut、Remix、Blend或者Loop这些功能或生成的作品超过5s时,需要支付额外积分,功能用得越多、时长越长扣得也越多。
额外所需积分 | 图源:ChatGPT官网
因此,纵使Sora带来了许多颠覆性的AI功能,想要注意体验也需要付出一定的代价。
有些用过多家视频AI的用户则表示,Sora是他们用过最贵的文生视频大模型。
“对标 Sora”成为现实
随着Sora Turbo的正式发布,“对标Sora”的话题又一次引起了关注。
自2月份Sora预告发布以来,Sora一度销声匿迹,OpenAI对外界也一直保持沉默。
与此同时,国内市场上却涌现出了众多文生视频大模型,如快手可灵AI、智谱清影AI、海螺AI等。
在这些国产视频AI发布时,不少科技媒体第一时间将它们广泛地与Sora进行对比,并打上了“对标Sora”、“国产Sora”等标签。
但一些业内人士对此并不认同,他们始终认为,这些AI与Sora并非同一概念,之间有着本质上的差别。
如今,随着更高级的Sora Turbo正式亮相,是时候通过具体的效果展示为这场"对标"争论画一个句号。
那就先来聚焦官方的直播演示。
在长达数十分钟Sora的功能展示中,OpenAI通过直播向外界展示了Sora的强大能力:
能够生成最高1080p分辨率、最长20秒、支持16:9/1:1/9:16等多种画面比例的视频。
图源:Sora官网
用户可以输入文字或上传图像,利用全新上线的UI界面对生成的视频进行修改、创建、扩展、循环、混合,甚至完全基于文本生成全新的内容。
OpenAI强调,Sora无法实现一键生成一段故事片,而是需要不断优化。
例如,如果用户需要生成一段较长的视频,则需要打开分镜(Storyboard)功能,该功能打开后将在页面上展示四个视频,用户可以从不同视角了解视频细节。
图源:OpenAI直播
点击分镜中的视频,用户可以在描述框输入具体的提示词,也可以设置风格、画面比例、时长、分镜个数、分辨率等元素。
一切就绪后,一条完整的视频随即就能生成。
如果说听上去依然很空洞,别着急,接下来给大家展示OpenAI直播中演示的具体案例。
直播中,OpenAI团队在描述框中输入了“一只黄尾白鹤站在小溪里”的提示词,并把生成出的视频放在了时间轴的前面部分;
随后,他们又在新的描述框中输入提示词“这只鹤将头探入水中并叼出一条鱼”,并把这段视频放在了同一个时间轴的后半部分。
两段视频并不连续,但Sora可以自行生成中间的过渡片段,使之成为一段完整的视频。
图源:OpenAI直播
在另一个演示中,OpenAI展示了如何用Remix工具改变视频中的物体,从而优化你想要的视频。
例如,在前面分镜部分的演示中,OpenAI给出的提示词为“长毛猛犸象走过沙漠景观”;
而在后续的优化提示框中,可以直接输入“把猛犸象变成「机械猛犸」”,就得到了下面这样一条视频。
图源:OpenAI直播
更多奇妙的功能等待着用户们自行去探索,这里不做过多赘述。
小编更希望聊一聊的是,Sora是否真的“远远超越”咱们国产自己的视频AI。
事实上,好奇这一点的网友非常多,在短短不到一天的体验中,外网就爆出了不少Sora的不足之处:
在用户输入提示词“一只鹈鹕沿着俯瞰港口的沿海小径骑自行车”后,Sora对应生成了一段视频,但在该视频画面中,鹈鹕却像突然吃了云南菌子一样,在中途莫名其妙地变为向相反的方向骑行。
图源:网易新闻
还有外网网友爆料,Sora对于性别的概念比较模糊,当提示词过长的时候,会出现把“一男一女”生成为“两个女孩”的画面。
不过,当我们把同一段提示词交给各家AI进行生成时,它们各自的问题也随之暴露。
据了解,有用户反馈,当提示词为“维京演员的情感表演。当演员皱眉时,镜头推到脸上”,Sora、快手可灵、MiniMax海螺表现各有不同。
具体来说,Sora的视频镜头氛围出色,粗看有电影大片风范,但无法体现“演员皱眉”、“镜头推到脸上”。
图源:Sora
快手可灵AI的表现则较为严谨,基本一比一根据提示词生成视频,但画面也相对较为死板。
图源:可灵AI
而MiniMax海螺生成的视频也有好有坏,亮点在于表情变化更加明显,缺点则是运镜提示词完全理解错误,变成了“镜头逐渐拉远”。
图源:海螺AI
总的来说,这些视频大模型都具有各自的优势,当然也存在属于它们自己的不足等待被解决。
随着Sora Turbo的正式发布,国内外视频AI的竞争将更加激烈。
哪怕是OpenAI,也需要继续学习与进步,让技术优势变成真正的产品优势。
作者 | 刘峰
来源:科技头版一点号