视频生成模型“卷”起来了:可灵刚登顶,美国Runway又上新

B站影视 日本电影 2025-04-01 18:07 1

摘要:生成一致性,一直是视频生成模型面临的最大难点之一。例如,在AI生成的视频中,同一个角色在不同场景出现时,往往会出现外观不一致的问题。Gen-4则可以根据单一参考图像,在不同镜头中保持角色形象的一致性,让用户在不同光照条件、位置和处理方式下生成一致的角色。

中美视频生成大模型的竞赛,成为这两天AI领域的新热点。

4月1日,美国知名视频模型公司Runway 发布新一代人工智能模型Runway Gen-4,用户无需额外微调或接受特定培训即可进行创作。

据介绍,Gen-4 擅长生成具有逼真动作以及主题、对象和风格一致性的高度动态视频。

生成一致性,一直是视频生成模型面临的最大难点之一。例如,在AI生成的视频中,同一个角色在不同场景出现时,往往会出现外观不一致的问题。Gen-4则可以根据单一参考图像,在不同镜头中保持角色形象的一致性,让用户在不同光照条件、位置和处理方式下生成一致的角色。

当用户要制作具体场景时,只需提供拍摄对象的参考图像并描述拍摄的构图,即可获取涵盖该场景下不同方位画面(every angle of any scene)的视频。

此外,Gen-4 在模拟现实世界物理方面取得了重大进展。生成的视频可以无缝地与实景、动画和 VFX 内容相结合,朝着通用生成模型方向迈出了一大步。

目前,Runway 正积极与业界合作。例如,Runway 已与 LIONSGATE 合作探索电影制作。

值得一提的是,在3 月 27 日刚刚更新的Artificial Analysis 视频生成模型榜单上,快手旗下的可灵1.6pro 以 1000 分成绩登顶。而Runway的上一代模型Gen 3 Alpha Turbo排在第6位。

去年12月发布的可灵1.6大模型,以对物理规律的理解见长,逼真的现实世界效果,让可灵生成视频的物理真实感大幅提升。

在一致性方面,可灵1.6同样表现出色。截至3月28日,在VBench2.0(用于评测视频生成模型性能的基准平台)中,可灵1.6在视频生成中,对场景中的各个物体、人物等的保持和完整性维护能力(Instance Preservation)中排名第一。

随着Runway最新版本的升级,它与可灵1.6的能力对比势必成为市场关注的焦点。

来源:观察者网

相关推荐