谷歌发布VEO3.1，让AI视频更接近大片效果

摘要：在AI视频生成竞争进入“精细创作”阶段之际，以及Sora App的大火，Google不得不再次出手。

在AI视频生成竞争进入“精细创作”阶段之际，以及Sora App的大火，Google不得不再次出手。

今日，Google DeepMind与Google Labs 联合宣布推出 Veo 3.1，其最新一代AI视频生成模型，并为AI创作平台 Flow 带来重大升级：全面引入音频生成、镜头编辑与物体插入、删除功能，赋予用户真正的“导演级控制权”。

据官方介绍，自Flow推出以来，已生成超过 2.75亿条视频，Veo 3.1的到来意味着AI视频制作从“能拍”进入“能导”的新阶段。

与前代Veo 3相比，Veo 3.1在三个维度实现突破：

全链路音频生成：支持“Ingredients to Video”“Frames to Video”“Extend”等功能的同步音效生成；

更强叙事控制力：可通过首尾帧、参考图像精确定义镜头节奏与故事走向；

更真实的质感还原：强化光影、材质、动作细节，整体逼真度显著提升。

Google DeepMind产品经理 Jess Gallegos 表示：

“Veo 3.1带来了音画统一的叙事能力，让创作者第一次能在AI视频中‘讲故事’，而不仅是‘做片段’。”

Google将Veo 3.1强大的视频模型全面接入Flow平台，使创作者能够像剪辑师一样编辑AI视频。

音频全面融入视频生成

Veo 3.1可为每个场景自动生成拟合音效与环境声，包括风声、水声、脚步声与背景配乐。这让AI视频首次具备“情感维度”，实现真正的视听同步叙事。

Ingredients to Video：可同时导入多张参考图像，精准控制角色、风格、场景与光影。

Frames to Video：输入首尾帧，AI自动生成中间镜头，实现自然过渡或艺术化转场。

Extend：基于上一个片段的最后一秒，生成连贯续拍，实现分钟级长镜头效果。

AI“视频修图”：插入与删除新功能

Google首次在Flow中引入视频级“修图”功能：

Insert：可添加任意元素，从人物、物体到奇幻生物，AI自动匹配阴影与光线，使其自然融入画面。

Remove（即将上线）：用户可直接删除画面中的角色或物件，AI将重建背景，让“删除无痕”。

这意味着，AI创作从“一次性生成”迈向“反复编辑”，让视频制作更接近专业后期。

无缝衔接Gemini与Vertex生态

Veo 3.1同步接入 Gemini API 与 Vertex AI，企业和开发者可在应用中直接调用这套生成体系。这不仅让Flow成为创作者平台，也让Veo 3.1成为Google AI生态的底层视频引擎。

应用场景：AI从“视频生成”走向“视频导演”：

创作者：可用参考图像+音频脚本构建完整短片；

媒体机构：在新闻或纪录片制作中生成过渡镜头与背景音；

游戏公司：快速生成叙事动画、CG预告片；

教育与广告行业：一键创建定制化、场景化教学视频与产品短片。

与OpenAI的Sora主打端到端生成不同，Google的Veo 3.1+Flow路径更像是一个“AI创意工作台”：

Sora = AI摄影机（输入文字→输出视频）

Veo 3.1 + Flow = AI剪辑台 + 调色师 + 音效师

这种“模块化创作”让Flow不仅是AI视频工具，更像是下一代Adobe Premiere + Midjourney的混合体。

Flow现在不只是AI视频工厂，更是AI版《好莱坞导演训练营》。Sora让你能拍，Veo让你能导。AI的下一个战场，是谁能讲好故事。（转自AI普瑞斯）

来源：鞭牛士

标签：视频谷歌大片 sora vertex

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!