阿里巴巴升级视频生成人工智能模型追赶全球竞争对手

摘要：昨天看到新闻说阿里巴巴更新了一个视频生成模型，这玩意儿现在火得不行。他们搞的新系统叫通义万相，好像能用一张照片加一段录音，就能做出电影里那种动人的数字人视频。比如说要是你上传一张明星照片和台词录音，就能生成一段表情到位的视频，听起来跟真人差不多。

昨天看到新闻说阿里巴巴更新了一个视频生成模型，这玩意儿现在火得不行。他们搞的新系统叫通义万相，好像能用一张照片加一段录音，就能做出电影里那种动人的数字人视频。比如说要是你上传一张明星照片和台词录音，就能生成一段表情到位的视频，听起来跟真人差不多。

据说是周二刚发布的，这家公司想趁着中美那帮大厂搞技术竞赛的时候赶上趟。以前拍个电影要搭景子、打灯光，现在可能一张照片就能搞定。有家影视公司测试过，用这个模型做短片，从照片到成片只需要一天，比传统绿幕拍摄快好多。

网上说这个模型厉害的地方在哪儿呢？人家说把神经网络弄了弄，能把细微的表情做到九成二的准确率。另外还有个什么多模态对齐算法，能让嘴型和声音匹配得更好。不过对比国外的Meta和百度那个文心一言，到底谁更强现在还说不准。

技术竞赛越来越卷。现在大厂都在比算力，阿里的云要跟亚马逊、微软的GPU集群对着干。应用场景也分好几块，像电商直播用虚拟主播，好莱坞特效公司也在搞类似的。关键还是看谁能把开源做得好，吸引开发者加入阵营。

最近欧盟那边出了个人工智能法案，说是要管管这些技术滥用的问题。虽然模型能生成高清视频了，但造假的风险也大了。比如怎么识别假视频，谁来负责版权，这些都没定论。有个教育公司的虚拟老师项目，现在搞得大家担心会不会影响孩子学习注意力。

这模型还能用在更多地方，比如在线教育请虚拟专家讲课，医院可能有数字医生。国家那边也出台政策支持文化数字化，估计接下来几年这领域会爆发。不过具体怎么商业化，免费版和收费版怎么平衡，还在摸索阶段。

现在阿里开放这个模型给普通人用，小公司也能玩得起高级技术了。但好处坏处都有，要是谁拿去做假视频骗人怎么办？最近有开发商者用这模型做特效短片，确实省事儿，但也引来不少争议。反正技术发展这么快，规矩得赶紧跟上才成。

来源：颜姐开聊

标签：视频模型人工智能阿里巴巴竞争对手

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!