阿里巴巴升级视频生成人工智能模型 追赶全球竞争对手

B站影视 内地电影 2025-08-28 10:40 3

摘要:昨天看到新闻说阿里巴巴更新了一个视频生成模型,这玩意儿现在火得不行。他们搞的新系统叫通义万相,好像能用一张照片加一段录音,就能做出电影里那种动人的数字人视频。比如说要是你上传一张明星照片和台词录音,就能生成一段表情到位的视频,听起来跟真人差不多。

昨天看到新闻说阿里巴巴更新了一个视频生成模型,这玩意儿现在火得不行。他们搞的新系统叫通义万相,好像能用一张照片加一段录音,就能做出电影里那种动人的数字人视频。比如说要是你上传一张明星照片和台词录音,就能生成一段表情到位的视频,听起来跟真人差不多。

据说是周二刚发布的,这家公司想趁着中美那帮大厂搞技术竞赛的时候赶上趟。以前拍个电影要搭景子、打灯光,现在可能一张照片就能搞定。有家影视公司测试过,用这个模型做短片,从照片到成片只需要一天,比传统绿幕拍摄快好多。

网上说这个模型厉害的地方在哪儿呢?人家说把神经网络弄了弄,能把细微的表情做到九成二的准确率。另外还有个什么多模态对齐算法,能让嘴型和声音匹配得更好。不过对比国外的Meta和百度那个文心一言,到底谁更强现在还说不准。

技术竞赛越来越卷。现在大厂都在比算力,阿里的云要跟亚马逊、微软的GPU集群对着干。应用场景也分好几块,像电商直播用虚拟主播,好莱坞特效公司也在搞类似的。关键还是看谁能把开源做得好,吸引开发者加入阵营。

最近欧盟那边出了个人工智能法案,说是要管管这些技术滥用的问题。虽然模型能生成高清视频了,但造假的风险也大了。比如怎么识别假视频,谁来负责版权,这些都没定论。有个教育公司的虚拟老师项目,现在搞得大家担心会不会影响孩子学习注意力。

这模型还能用在更多地方,比如在线教育请虚拟专家讲课,医院可能有数字医生。国家那边也出台政策支持文化数字化,估计接下来几年这领域会爆发。不过具体怎么商业化,免费版和收费版怎么平衡,还在摸索阶段。

现在阿里开放这个模型给普通人用,小公司也能玩得起高级技术了。但好处坏处都有,要是谁拿去做假视频骗人怎么办?最近有开发商者用这模型做特效短片,确实省事儿,但也引来不少争议。反正技术发展这么快,规矩得赶紧跟上才成。

来源:颜姐开聊

相关推荐