摘要:OpenAI 于周一推出了其文本转视频 AI 模型Sora ,这是其为期 12 天的「ship-mas」产品发布系列的一部分。
鞭牛士报道,12月10日消息,据外电报道,OpenAI 于周一推出了其文本转视频 AI 模型Sora ,这是其为期 12 天的「ship-mas」产品发布系列的一部分。
OpenAI今天在Sora.com上面向美国和大多数其他国家/地区的 ChatGPT 订阅用户推出,还有一个新模型 Sora Turbo。这个更新的模型增加了从文本生成视频、动画图像和混合视频等功能。
OpenAI 表示,通过 ChatGPT Plus 订阅,用户可以生成最多 50 个优先视频(1,000 个积分),分辨率最高可达 720p,时长为 5 秒。
上周推出的 ChatGPT Pro 订阅每月收费 200 美元,提供无限生成功能,最多可生成 500 个优先视频,同时将分辨率提高到 1080p,时长提高到 20 秒。
更昂贵的套餐还允许订阅者下载没有水印的视频,并同时进行最多五次生成。
OpenAI 于 2 月份首次发布了 其文本转视频 AI 模型 Sora。
在直播中,OpenAI 展示了 Sora 的新探索页面,其中包含其他社区成员制作的 AI 生成的视频。该公司重点介绍了一项名为故事板的功能,该功能可让您根据一系列提示生成视频,以及将照片转换为视频的功能。
OpenAI 还演示了一个混音工具,可让您使用文本提示调整 Sora 的输出,以及一种使用 AI 将两个场景混合在一起的方法。
OpenAI 表示,使用 Sora 生成的视频将带有可见的水印和 C2PA 元数据,以表明它们是使用 AI 制作的。在将图像或视频上传到 Sora 之前,OpenAI 会提示您勾选一项协议,该协议规定您上传的内容不包含 18 岁以下的人、露骨或暴力内容以及受版权保护的材料。
它表示,滥用媒体上传可能会导致帐户被禁止或暂停。
OpenAI 研究副总裁 Aditya Ramesh 在直播中表示:作为 OpenAI,我们显然面临着巨大的压力。我们希望阻止 Sora 的非法活动,但我们也希望在创造性表达与非法活动之间取得平衡。我们知道……这将是一个持续的挑战,我们可能无法在第一天就做到完美。我们一开始有点保守,所以如果我们的审核不太到位,请给我们反馈。
「我们不希望世界只有文字。」OpenAI 首席执行官 Sam Altman 在周一的直播声明中表示。
奥特曼补充道:视频对我们的文化很重要。
如果用户没有 ChatGPT 订阅,仍然可以浏览其他人使用 Sora 制作的 AI 生成视频。虽然该模型今天将在美国和许多其他国家/地区推出,但OpenAI 首席执行官 Sam Altman 表示,在欧洲大部分地区和英国推出可能还需一段时间。
就在 Sora 发布一周前,一群自称参与该公司 alpha 测试计划的艺术家泄露了该产品,以抗议 OpenAI 将其用于他们所称的无偿研发和公关。
OpenAI 于 10 月完成了最新一轮融资 ,估值达 1570 亿美元,其中包括该公司从众多投资公司和大型科技公司筹集的 66 亿美元。该公司还获得了 40 亿美元的循环信贷额度,使其总流动资金超过 100 亿美元。
文生视频可能是下一个前沿
借助 Sora,ChatGPT 制造商希望与 Meta 和 谷歌等公司的视频生成 AI 工具展开竞争,谷歌 于 1 月宣布推出 Lumiere 。其他初创公司也推出了类似的 AI 工具,例如 Stability AI 的 Stable Video Diffusion。 亚马逊还发布了 Create with Alexa,这是一种专门生成基于提示的儿童短动画内容的模型。
聊天机器人和图像生成器已经进入消费者和商业领域,视频可能成为生成式人工智能的下一个前沿。虽然这些创意机会会让一些人工智能爱好者兴奋不已,但随着全球各大政治选举的举行,新技术带来了严重的虚假信息问题。机器学习公司 Clarity 的数据显示,人工智能生成的深度伪造视频数量同比增长了 900%。
OpenAI 将多模态性(即文本、图像和视频生成的结合)作为其提供更广泛的 AI 模型套件的一个突出目标。
博主首次评测亮点
YouTuber Marques Brownlee 于周一早上在其频道发布的视频中透露了这一消息。Brownlee 抢先体验了 Sora,并在 15 分钟的评论中给出了他的初步印象。
布朗利表示, Sora 位于Sora.com上,其主页滚动展示了最近生成并由 OpenAI 策划的 Sora 视频。
值得注意的是,该工具并未内置于 OpenAI的人工智能聊天机器人平台ChatGPT中。目前,Sora 似乎是其独立的产品。
Sora 主页上的视频可以收藏到已保存选项卡中,以便以后查看,也可以组织到文件夹中,点击后可以查看制作视频时使用了哪些文本提示。
据 Brownlee 介绍,Sora 可以根据上传的图片和提示生成视频,还可以编辑现有的 Sora 制作的视频。
使用重新混合功能,用户可以描述他们希望在视频中看到的更改,Sora 会尝试将这些更改合并到新生成的剪辑中。重新混合有一个“强度”设置,让用户指定他们希望 Sora 对目标视频进行多大程度的更改,值越高,生成的视频就越具有艺术自由度。
布朗利表示,Sora 可以生成高达 1080p 的素材,但分辨率越高,生成视频所需的时间越长。1080p 素材所需的时间是 480p(最快的选项)的 8 倍,而 720p 素材所需的时间是 4 倍。
布朗利表示,在他的测试中,生成 1080p 视频平均需要几分钟。「目前,几乎没有人使用它。」他说。「我想知道,当它向所有人开放时,需要多长时间。」
布朗利表示,除了生成一次性视频片段外,Sora 还具有故事板功能,让用户可以将提示串在一起,创建场景或视频序列。这大概是为了帮助保持一致性——这是 AI 视频生成器的一个臭名昭著的弱点。
但 Sora 的表现如何?布朗利说,它与其他生成工具一样,存在同样的缺陷,即与物体永久性相关的问题。在 Sora 视频中,物体以不合理的方式从彼此前面或后面经过,并且毫无理由地消失和重新出现。
布朗利说,腿是索拉面临的另一个主要问题。只要有腿的人或动物需要在剪辑中长时间行走,索拉就会分不清前腿和后腿。布朗利说,腿会以一种解剖学上不可能的方式来回交换。
布朗利表示,Sora 内置了多项保护措施,禁止创作者制作涉及 18 岁以下人群、暴力或露骨主题的影片,因为这些影片可能会侵犯第三方的版权。
布朗利表示,Sora 也不会使用带有公众人物、知名人物或徽标的图片来制作视频,而且它会在每个视频上添加水印 — — 尽管这种视觉水印很容易被裁剪掉。
那么,Sora 有什么用呢?布朗利发现它对于制作特定风格的标题幻灯片、动画、摘要和定格镜头等很有用。但他并不推荐它用于任何照片写实的东西。
「这是人工智能生成的视频,这令人印象深刻,但你很快就能看出这是人工智能生成的视频。」他谈到 Sora 的大部分剪辑时说道。「事情真的变得很古怪。」
来源:鞭牛士Bianews一点号