摘要:为了展示对物理学的理解,官方展示了一段视频,球员投篮不中,球会从篮板上反弹。其他一些视频案例则涵盖了骑马的男子、沙滩排球比赛、滑板技巧展示、体操运动,以及跳水板上的纵身一跃等。
以前,短视频解构了我们的生活。现在,Sora 解构了短视频。
当地时间周二,OpenAI 推出 Sora 2 和 Sora App。前者是 Sora 1 的新版本,后者则是一个类似 TikTok 的短视频 App。
与 TikTok 不同的是,Sora App 上面的每个视频都是由 AI 生成的。
在 Sora App 上,短视频不再刚需生活,不再承载记录的任务,甚至不再需要真实的素材。它把短视频彻底抽象成“可被刷到的内容”,连拍摄都省了。
它唯一目的就是用所谓的创造力、想象力吸引我们本就分散的注意力。或许还有打广告。
当然,技术本身确有亮点。
OpenAI 表示,Sora 2 能更好地遵循物理定律,并且具有更强的可控性,能够遵循更加复杂的指令,从而实现更逼真的效果。
“Sora 2 是视觉生成领域的一次 GPT-3.5 式跳跃。”OpenAI 写道。
为了展示对物理学的理解,官方展示了一段视频,球员投篮不中,球会从篮板上反弹。其他一些视频案例则涵盖了骑马的男子、沙滩排球比赛、滑板技巧展示、体操运动,以及跳水板上的纵身一跃等。
Sora 2 相比上一版的提升在于能够给视频配音,可以配音效、背景音和人声,实用性进一步提升。当然,这一功能并非 Sora 2 首发和独创,谷歌几个月前发布的 Veo 2 已经具备配音功能。
OpenAI 在官方新闻稿中强调,Sora 2 优先考虑用户创造力而非让用户进行被动接收。
音频融合是 Sora 2 的一个关键提升。它在生成对白、环境音、音效等方面,追求画面与声音同步匹配,包括声音与动作节奏呼应,以及声音来源在空间中合理分布。
比如,通过观看某一名用户的视频,Sora 2 可以将这名用户的内容插入到任何生成式视频之中,并能准确刻画其外貌和声音,甚至也能复刻动物或物体的外貌和声音。在 Sora 2 的官方示例视频中,OpenAI 展示了一段其员工使用 Sora 2 转换自身视频的案例,演示了一个人追逐鸵鸟的片段。
由于 Sora 2 采用的全部是 AI 视频,因此用户无法自己上传视频,只能用 Sora 2 生成最长为 10 秒的短视频。
用户可将真实人物(自己或他人)的面貌与声音录入系统,在生成视频时将其嵌入虚拟场景。OpenAI 称之为 cameo 功能。
Sora 2 会保留其外貌、声音特征,使其在生成场景中仍具有辨识度。这样一来,生成的内容不仅是抽象场景,而带有“可识别人物参与”的意味。
视频风格方面,Sora 2 支持多种风格,用户可以指定写实、电影、卡通甚至抽象艺术的风格,并通过指令细化镜头、光线与构图。它还支持多镜头切换,保持场景与人物的连续性。
除了 Sora 2,OpenAI 还发布了一款名为 Sora 的社交应用 App,该 App 由 Sora 2 提供支持。
这个新 App 类似 TikTok:用户在垂直视频流中滑动、浏览;默认视频长度为 10 秒;所有内容都是 AI 生成的。
如果你想发布带有自己形象的视频,只需一段一次性视频和音频,cameo 功能就能在任何场景中重现你的形象。
OpenAI 表示,一次性视频和音频除了用于捕捉用户的形象之外,也在于验证身份。
这个 App 被包装成社交应用,用户除了自己生成视频外,还可以与其他用户互动。他们既可以浏览其他用户的视频,也可以基于他人视频进行混合创作。
OpenAI 承诺,每位用户都能掌握自己在 cameo 视频中的形象和声音使用权。一旦自己的肖像或声音被别人使用,就可以算作是共创者,而共创者可以撤回授权、删除包含其 cameo 的视频。
也就是说,只要别人生成了带有你形象的视频,你就有权删除这些视频,即使这些视频保存在他们的草稿箱里。
在内容审核与生成策略上,OpenAI 对公众人物的形象使用设置了较严格的门槛。若某个公众人物没有上传 cameo,则其形象默认不能被生成。极端和成人向内容目前被禁止。
OpenAI 还表示,Sora App 搭载了一种新型的自然语言推荐算法,能够实现信息流算法的自定义。与此同时,Sora 2 正在优化自动化审核功能和人工监督功能。
眼下,Sora App 已经可以从苹果应用商店下载,目前仅限于美国和加拿大的受邀用户,未来将扩展到其他国家和地区。
尽管 Sora App 目前仅限邀请用户使用,但是 ChatGPT Pro 订阅用户无需邀请即可试用 Sora 2 Pro 模型。未来,OpenAI 将扩大访问权限,并有可能提供付费版本。OpenAI 表示,其唯一的盈利计划是在需求旺盛时向用户收取制作额外视频的费用。
早在 2025 年 4 月,就有外媒指出 OpenAI 已经做好加入社交媒体竞争的准备。今天的最新发布,标志着其在面向消费者的娱乐领域迈出的最大一步。
但它能否真正改变短视频与社交平台的格局,仍然存在巨大不确定性。问题的关键在于,人们为什么会花时间去看这些 AI 生成的视频。
如果你看了 OpenAI 的直播,或许会萌生出一种荒诞感受:一开始惊讶于它的炫技和逼真程度,慢慢过渡到“我明知道它不是真的,那我为什么还要刷这些 AI 视频?”的灵魂拷问。
仅仅是好玩、新鲜,是不够的。短视频的魅力,更在于它承载了真实的人、真实的故事与真实的情绪,背后有创作者的生活与个性。
相比之下,全 AI 生成的内容缺乏这种人与人之间的连接。对大多数人而言,它的新鲜感可能只能维持很短时间,时间一长就会显得空洞乏味。
创作端同样面临悖论。OpenAI 标榜其 Sora 2 的“创造力”。的确,它降低了制作成本,让人人都能生成精妙的短视频,但当门槛趋近于零,产出的内容往往会趋同,难以形成独特的价值。就像滤镜、美颜在最初带来惊艳,最终却让人们都成了“网红脸”,失去了个性。
当我们看到自己喜欢的博主在分享生活,他/她的喜怒哀乐会触动你,这是人类原始且纯粹的情感共鸣,能跨越文化、经历、背景和种族。
但是如果你看的是 AI 视频,你的脑海中就会一直有个声音在告诉你,你看到的不是真的。那么无论他/她说什么、做什么、展示什么,都很难真正触发你情感上的波动。
站在 OpenAI 的角度,推出 Sora 应用的战略意义或许并不在于与 TikTok 之类的短视频平台掰手腕,而是两点:一是建立数据循环,让用户生成与互动反哺模型迭代;二是抢先占位 AI 原生内容平台的赛道,为未来形态的演进留好入口。
Sora 2 的真正价值,仍更多地体现在技术的进步上,至于是否撑起一个受欢迎的短视频社交平台,还需时间的验证,TikTok 的这条路走了近 10 年,AI 的加速与赋能能否形成一种主流文化,暂时还无法回答。
参考资料:
https://x.com/OpenAI/status/1973075422058623274?ref_src=twsrc^tfw|twcamp^tweetembed|twterm^1973075422058623274|twgr^b4b599a7d0f0e7ce16ed3ded8e0aa01ab50384b9|twcon^s1_c10&ref_url=https://finance.yahoo.com/news/openai-launching-sora-app-own-182853827.html
来源:DeepTech深科技一点号