外媒报导“1图就能生成逼真视频”字节跳动推AI模型 增深伪影片忧虑

B站影视 2025-02-09 20:57 3

摘要:热门短影音平台TikTok在美国命运生死未卜之际,其在北京的母公司「字节跳动」(ByteDance)本周悄悄发布了一种堪称先进的视频生成人工智能(AI)模型「OmniHuman-1」,只要一张图片就能生成影片,专家称是「所见过最厉害的」,却也引发新的深伪影片(

总部在北京的科技公司「字节跳动」日前推出仅靠一图片,就可生成完整视频的AI模型「OmniHuman-1」

热门短影音平台TikTok在美国命运生死未卜之际,其在北京的母公司「字节跳动」(ByteDance)本周悄悄发布了一种堪称先进的视频生成人工智能(AI)模型「OmniHuman-1」,只要一张图片就能生成影片,专家称是「所见过最厉害的」,却也引发新的深伪影片(deepfakes)担忧。

美国广播公司新闻网(ABC News)报导,字节跳动在报告中称该模型以超过1万8700小时的真人影片进行训练,达到前所未见的准确性和个性化。

在示范影片中,著名的爱因斯坦肖像活了起来、栩栩如生地说话;或是Ted演讲者发表演讲、音乐家边弹钢琴边唱歌,显示此模型只要单一影像和音频片段,就能产生任意高宽比的逼真影片。

AI专家阿杰德(Henry Ajder)表示这使得人们更容易沦为目标。「以前可能需要数百甚至数千张图片来训练,才能制作有趣且几可乱真的影片。现在只要一张图,用户就可以创造缺乏AI生成迹象(AI往往在手部动作或口型同步露馅)的影像,还可能躲过AI侦测工具的法眼…这可能是我见过最厉害的模型,它将所有不同的多模式活动合而为一。能够生成与自订音频相配的影片非常引人注目,且不失真实度,它们非常令人印象深刻。」虽然OmniHuman尚未向公众发布,但阿杰德预测可能很快就会在字节跳动的产品上推出,包括TikTok。

ABC新闻撰稿人、前国安部情报主管科恩(John Cohen)称,AI生成的高品质影片,恐导致威胁急剧扩大,「美国正处于一个动态而危险的威胁环境中,这种威胁很大程度上是由外国情报机构、恐怖组织、犯罪集团、家暴者故意放置在网上的内容所推动,目的是煽动和告知犯罪及暴力活动。」而OmniHuman这种技术恐让不肖分子「更高效、更快速、更便宜」地制造深伪影片。

来源:跟着波叔看世界

相关推荐