摘要:在近日于北京希尔顿酒店举行的T-EDGE大会上,一位加拿大企业家的演讲引起了广泛关注。LipDub.AI的创始人兼首席执行官Jonathan Bronfman在会上展示了一项革命性的唇音同步技术,该技术不仅大幅降低了视频制作成本,同时保持了高质量水准。
在近日于北京希尔顿酒店举行的T-EDGE大会上,一位加拿大企业家的演讲引起了广泛关注。LipDub.AI的创始人兼首席执行官Jonathan Bronfman在会上展示了一项革命性的唇音同步技术,该技术不仅大幅降低了视频制作成本,同时保持了高质量水准。
在提到视频制作时,“昂贵”和“耗时”往往是人们首先想到的两个词。好莱坞之所以能在全球电影业中独占鳌头,很大程度上得益于其雄厚的资金支持。然而,LipDub.AI却提供了一种既能降低成本又能保持高质量的解决方案。
Bronfman在演讲中展示了多个令人惊叹的视频片段,其中一段视频显示,一位名叫Craig Smith的前《纽约时报》记者(来自华盛顿州)用普通话询问费率时,唇音同步效果极其逼真,让人误以为他是中国人。Bronfman还展示了如何将视频内容从弗拉芒语翻译成英语,以及如何通过输入新的台词从旧视频中生成新视频。无论是《阿凡达》、《星际迷航》还是《权力的游戏》中的科幻语言,这项技术都能迅速掌握并应用。
Bronfman不仅是LipDub.AI的掌舵人,还是另一家公司MARZ(全称Monsters, Aliens, Robots, Zombies)的首席执行官。MARZ曾为迪士尼、Netflix和亚马逊制作视觉特效,这段经历让Bronfman对音视频制作有了深入了解。他发现,整个行业存在同质化问题,大家使用相同的技术栈和艺术家资源。
2019年,Bronfman认识到人工智能(AI)是降低成本、提高效率和产能的关键工具。于是,他组建了一支世界级的研发团队,由特拉维夫大学视觉计算教授Daniel Cohen-Or和西蒙弗雷泽大学计算机科学助理教授Ali Mahdavi-Amiri领导。他们的首个产品Vanity,可以在传统视觉特效流程的基础上,将2D年龄变化、美化、假发和假肢修复的速度提高300倍。该产品因其高性价比和卓越品质在好莱坞广受欢迎。
2021年,Bronfman观看了Netflix上的韩国剧集《鱿鱼游戏》。他发现,虽然该剧在英语市场大受欢迎,但唇音同步存在问题。于是,他联系了Cohen-Or和Mahdavi-Amiri,并决定解决这个问题。随后,他们为好莱坞创造了LipDub唇音同步技术。
“这不是TikTok上的滤镜。这是真正的4K高清分辨率。你需要调整姿势、改变相机、调整光线和遮挡物。”Bronfman强调说,好莱坞仍然是行业的北极星或生产者的终极市场。
LipDub可用于视频内容翻译、自定义角色的对话更改和个性化定制。例如,品牌在不同市场为产品使用不同的名称。如果他们想拍摄广告并更改特定产品的名称,那么LipDub将是理想的选择。
由LipDub.AI开发的唇音同步技术同样适用于计算机生成(CG)角色。“这不仅仅是唇音同步。我们不想看到一张纸板一样的角色。它需要是动态的。因此,表情——角色是开心还是悲伤?我们需要确保保持原始表演的完整性。”Bronfman解释说。
这款目前仍处于测试阶段的应用程序将于2025年1月20日正式上线,并将广泛应用于广告和电子学习等多个行业。然而,Bronfman更倾向于根据质量而不是行业来划分用户案例。“让我们横向切割。让我们将用户分为关心质量的人和不关心质量的人。我们关心质量。这将继续是我们的北极星。”Bronfman说,“我们将为这些人提供服务。”
Bronfman指出,人工智能正处于一个转折点。“人们正在向这个领域投入大量资金。人们希望它更快、更实惠……他们想看到在给定市场或给定行业中推广或吸引受众的最有效、最积极的方式。”他强调说。
Bronfman认为,人工智能是解决视频和电影制作行业中高昂成本这一常见且持久问题的关键。虽然目前视频制作仍然缓慢且昂贵,但Bronfman提供了一个解决方案。“有了LipDub,视频可以被重复使用。你可以轻松地将内容全球化。”他在演讲的高潮部分总结道。
来源:ITBear科技资讯