摘要:科幻作家尼尔・斯蒂芬森在其1992年创作的小说《雪崩》里,描绘了一个与现实世界并行的网络空间——“元宇宙”(Metaverse)。在原著设定中,这一概念由主角“ Hiro Protagonist”提出,它脱胎于现实,与之平行共生、相互渗透,且永远保持在线状态。
科幻作家尼尔・斯蒂芬森在其1992年创作的小说《雪崩》里,描绘了一个与现实世界并行的网络空间——“元宇宙”(Metaverse)。在原著设定中,这一概念由主角“ Hiro Protagonist”提出,它脱胎于现实,与之平行共生、相互渗透,且永远保持在线状态。
如今,“元宇宙”已成为热门话题,众多相关产业也逐渐从小众迈向大众视野,虚拟数字人便是其中极具代表性的一例。
01
虚拟数字人市场
虚拟数字人,以数字化形态存续,拥有类人的外貌体征,其行为依托前沿科技呈现,具备三大核心特性:存在于非物理空间、由数字技术合成、高度拟人化。
随着虚拟数字人愈发融入现实生活,人们不禁对其技术实现路径充满好奇,同时也在思索,当它们踏入人类社会,会给人类带来何种挑战?
据中国人工智能产业发展联盟发布的《2020年虚拟数字人发展白皮书》,虚拟数字人的演进与其制作技术的革新紧密相连。
从早期的手工绘制起步,历经电脑绘图,再到如今人工智能赋能下的合成技术,伴随深度学习算法的接连突破,虚拟数字人正朝着智能化、便捷化、多样化蜕变。
建模、物理仿真、渲染、面部捕捉以及人工智能等多元技术的持续迭代,不仅为虚拟数字人塑造了吸睛的外在,更尝试赋予其灵动的“内在”,从而让用户感受到亲切、乐于参与、沉浸其中。
02
虚拟数字人技术层面
量子位《硬科技深度产业报告》指出,在技术架构层面,虚拟数字人可归为真人驱动与计算驱动两大类型。
真人驱动模式在动作响应敏捷度与互动成效方面优势显著,在影视创作、虚拟偶像养成以及重要直播活动中应用广泛。
技术流程涵盖:一,形象构思与建模;二,模型绑定;三,表演捕捉;四,驱动及渲染;五,生成互动内容。
得益于图像识别技术的进阶,普通摄像头搭配优化的识别算法,便能精准捕捉动作,极大降低了真人驱动型内容创作的门槛。
相较而言,计算驱动型虚拟数字人凝聚了近年来多模态技术与深度学习领域的前沿成果。这类数字人的语音表达、面部神情以及肢体动作,主要依靠深度学习模型的运算结果实时驱动或离线渲染来达成最终呈现效果。
技术链路包括:一,设计形象,扫描真人形态并采集表演驱动数据;二,构建形象模型,绑定关键节点;三,训练各类驱动模型,此环节对最终效果起着决定性作用,充足且精准的驱动关键点与高精度驱动模型协作,能够逼真还原人脸、骨骼及肌肉的细微变化,塑造出以假乱真的表情驱动模型;四,基于输入的语音或文本转换语音,预测驱动表情等参数以制作内容;五,渲染生成成品,直播场景下则进行实时渲染。
总体而言,虚拟数字人的拟人化成效受三方面关键技术左右。
一方面,CG建模或图像迁移技术左右着外观呈现效果,关乎虚拟数字人外观的拟人程度;另一方面,以对话交互为核心的NLP技术,影响着用户的交互体验,继文本对话助手、语音AI助手后,该技术在虚拟数字人中持续担当“智慧大脑”角色;此外,CV等深度学习模型作用于驱动效果,直观反映在面部表情、肢体动作的动态变化上。
国际数据公司(IDC)预测,到2026年,中国人工智能数字人市场规模有望飙升至102.4亿元。展望未来,我们的社会或许将围绕虚拟人搭建起更为多元繁茂的虚拟生态。然而,在虚拟人市场蓬勃发展的背后,暗藏监管难题,法律、伦理层面的风险也不容小觑。
02
虚拟数字人所潜藏的风险
以2022江苏卫视跨年演唱会为例,还原邓丽君形象与音色的虚拟人惊艳亮相,引发全场热潮。西南大学法学院张新铭教授剖析指出,人们在为“复活”邓丽君的虚拟现实技术惊叹之余,往往容易忽视虚拟人现象衍生的诸多法律与伦理问题。
诸如被重现人物的名誉权守护、已故名人形象数字化的商业利用权限、虚拟人创作者或已故人物“复活”创作者的权责界定、虚拟艺人表演主办方或网络播放平台的审查职责,以及政府相关部门的监管义务等。
此外,还需防范虚拟人在学习进程中将偏见、恶意反馈给人类社会。或许在不久的将来,人类与虚拟人互动的时长将赶超与真人交流的时间,部分人群可能会沉溺于虚拟世界,将情感寄托于虚拟人,进而诱发一系列社会问题。
这迫切要求社会各界在紧跟技术革新步伐的同时,加速推进人文社会科学领域的相关研究,促使社会治理、伦理规范与技术创新协同共进,及时出台适配的法律法规与行业准则,护航虚拟人产业稳健前行。
当下,我们已然能够察觉,虚拟世界正逐步渗透现实世界。人们凭借数据的上传与更新,仿佛在虚拟天地中塑造了另一个“自我”,而虚拟人则以这些数据为基石,在与现实世界的交互中,悄然模糊了两个世界的边界。
置身科技的汹涌浪潮,愿我们怀揣好奇之心,秉持审慎态度,不断拓展未知的疆域。
来源:波波百谈一点号