摘要:在AI视频生成竞争进入“精细创作”阶段之际,以及Sora App的大火,Google不得不再次出手。
在AI视频生成竞争进入“精细创作”阶段之际,以及Sora App的大火,Google不得不再次出手。
今日,Google DeepMind与Google Labs 联合宣布推出 Veo 3.1,其最新一代AI视频生成模型,并为AI创作平台 Flow 带来重大升级:全面引入音频生成、镜头编辑与物体插入、删除功能,赋予用户真正的“导演级控制权”。
据官方介绍,自Flow推出以来,已生成超过 2.75亿条视频,Veo 3.1的到来意味着AI视频制作从“能拍”进入“能导”的新阶段。
与前代Veo 3相比,Veo 3.1在三个维度实现突破:
全链路音频生成:支持“Ingredients to Video”“Frames to Video”“Extend”等功能的同步音效生成;
更强叙事控制力:可通过首尾帧、参考图像精确定义镜头节奏与故事走向;
更真实的质感还原:强化光影、材质、动作细节,整体逼真度显著提升。
Google DeepMind产品经理 Jess Gallegos 表示:
“Veo 3.1带来了音画统一的叙事能力,让创作者第一次能在AI视频中‘讲故事’,而不仅是‘做片段’。”
Google将Veo 3.1强大的视频模型全面接入Flow平台,使创作者能够像剪辑师一样编辑AI视频。
音频全面融入视频生成
Veo 3.1可为每个场景自动生成拟合音效与环境声,包括风声、水声、脚步声与背景配乐。这让AI视频首次具备“情感维度”,实现真正的视听同步叙事。
Ingredients to Video:可同时导入多张参考图像,精准控制角色、风格、场景与光影。
Frames to Video:输入首尾帧,AI自动生成中间镜头,实现自然过渡或艺术化转场。
Extend:基于上一个片段的最后一秒,生成连贯续拍,实现分钟级长镜头效果。
AI“视频修图”:插入与删除新功能
Google首次在Flow中引入视频级“修图”功能:
Insert:可添加任意元素,从人物、物体到奇幻生物,AI自动匹配阴影与光线,使其自然融入画面。
Remove(即将上线):用户可直接删除画面中的角色或物件,AI将重建背景,让“删除无痕”。
这意味着,AI创作从“一次性生成”迈向“反复编辑”,让视频制作更接近专业后期。
无缝衔接Gemini与Vertex生态
Veo 3.1同步接入 Gemini API 与 Vertex AI,企业和开发者可在应用中直接调用这套生成体系。这不仅让Flow成为创作者平台,也让Veo 3.1成为Google AI生态的底层视频引擎。
应用场景:AI从“视频生成”走向“视频导演”:
创作者:可用参考图像+音频脚本构建完整短片;
媒体机构:在新闻或纪录片制作中生成过渡镜头与背景音;
游戏公司:快速生成叙事动画、CG预告片;
教育与广告行业:一键创建定制化、场景化教学视频与产品短片。
与OpenAI的Sora主打端到端生成不同,Google的Veo 3.1+Flow路径更像是一个“AI创意工作台”:
Sora = AI摄影机(输入文字→输出视频)
Veo 3.1 + Flow = AI剪辑台 + 调色师 + 音效师
这种“模块化创作”让Flow不仅是AI视频工具,更像是下一代Adobe Premiere + Midjourney的混合体。
Flow现在不只是AI视频工厂,更是AI版《好莱坞导演训练营》。Sora让你能拍,Veo让你能导。AI的下一个战场,是谁能讲好故事。(转自AI普瑞斯)
来源:鞭牛士