从“采销东哥”到千人千面直播:京东言犀数字人如何破局新赛道?

B站影视 电影资讯 2025-03-28 16:28 1

摘要:就在不少品牌陷入增长乏力的焦虑时,在京东云技术支持下,京东跑出了逆势增长的新故事:截至目前,言犀数字人给商家带来了超过140亿的GMV增量。

2025年,直播行业正面临前所未有的“内卷”,流量见顶、ROI疲软,越来越多的商家开始寻找新的破局契机。

就在不少品牌陷入增长乏力的焦虑时,在京东云技术支持下,京东跑出了逆势增长的新故事:截至目前,言犀数字人给商家带来了超过140亿的GMV增量。

所以,曾经动辄数万元、制作周期漫长的数字人,为何突然“飞入寻常百姓家”?

从“采销东哥”AI数字人的破圈,到超过9000家品牌密集应用,京东言犀数字人直播又能为商家和消费者带来哪些新价值?

过去,数字人之所以被诟病“成本高、效果差”,主要源自技术和硬件的双重制约。

一方面是硬件昂贵。早年间,打造一个高保真的3D数字人需多机位拍摄、海量训练和建模。2020年黄仁勋(NVIDIA创始人)在大会上展示过的数字人硬件成本就曾一度高达数百万美元……

其二,过去的数字人常被认为效果僵硬。一旦面对小角度、多片段衔接和长时应用,数字人往往难免出现卡顿、口型不匹配,表情生硬经常造就“翻车现场”。

得益于软硬件技术、AI领域的快速发展,2024年,京东言犀团队在“多模态交互式数字人”上实现了重大突破,将单个数字人生产成本大幅度降低,依托全新技术实现了4K高清、口型极度吻合等高逼真度,打破了传统数字人桎梏。

可以说,这项新技术的落地和应用,实实在在改变了早些年“只是噱头、成本极高”的刻板印象。

当下,数字人终于不再是“遥不可及的黑科技”,成为了品牌直播间里可以真真切切发挥作用、创造商业价值的“AI打工人”。

这套成果也为京东一举斩获中国智能科学技术最高奖——“吴文俊人工智能科学技术奖”特等奖(本年度唯一特等奖)。

单从技术层面来看,京东言犀团队在访谈中曾聊到,“恐怖谷”被认为是数字人落地的最大挑战,因为人对人脸和语音极其敏感,一旦出现微小不协调就会瞬间出戏。

当年“周鸿祎曾误以为刘强东AI数字人可能是真人视频”这一花絮看似调侃,却体现了技术逼真的程度对观众心理带来的冲击。

而数字人要真正跨越“恐怖谷”,除了视觉逼真,还需让消费者在短时间内对其产生信任。

此次京东言犀数字人的全新升级,通过多模态自然化行为生成,让数字人在不同角度、镜头切换、互动场景下依旧保持逼真度,配合情感化语音合成,成功跨过“恐怖谷”门槛。

简单总结一下,这次言犀数字人的升级主要在三方面实现了重大技术创新,解决了传统数字人“观感差、应答弱、交互假”的瓶颈:

一是低成本、高保真人体建模。通过首创基于骨架先验引导的单相机人体形象建模方法,极大降低采集与算力成本。

简单来说,过去做数字人需要支一个绿幕、三维扫描、素材拍摄、调试,每一步都烧钱烧算力,现在有了该技术,解决了传统素材采集条件要求高、建模成本高的问题。

二是多模态自然化行为生成技术,人对人脸、眼神最敏感,稍有闪失就“诡异”,京东言犀引入先验知识模型+细腻渲染,来确保证播时表现如真人,长时间也不会突然卡掉线或者五官移位,解决数字人容易“僵硬”的难题。

其次是语义一致多模态应答,实现声音、口型、表情一气呵成,直击AI主播最怕“嘴巴说东、表情往西”的痛点。

这点主要依托LiveTTS实现“零样本”情感化合成,与动作表情高度同步;多片段衔接时依旧自然,让观众难以察觉“AI破绽”。

“我们从采集到建模,再到表达合成,都尽量走‘端到端’直接生成的捷径”,京东言犀相关负责人在采访中提到,“最终达成高清、100%口型匹配,让消费者只凭肉眼很难分辨。”

如果说以往数字人更多还是概念展示或营销噱头,那么如今它正真正在品牌直播间里“挑大梁”。

据统计,超9000家品牌借力京东言犀数字人,创造了超过140亿的GMV增量,主要得益于以下几大优势:

首先就是让有需求的商家能用敢用。以往要做一个高保真数字人,少则数万、多则十几万,还需要专业团队辅助。

如今,京东把制作成本直线拉低至万元,中小商家甚至个人主播都能“拥有自己的数字人”,完成自主带货、商品推荐、解答疑问。

这种“白菜价普及”无疑扩大了数字人的应用边界。

其次24小时在线的数字人切实在人力层面做了大量支撑。

因为直播并不只存在于黄金档,“夜猫子”同样是潜在的消费群体。

真人主播难以熬夜,而数字人可以7×24小时在岗,对宝妈宝爸等碎片化购物人群十分友好。例如童装品牌巴拉巴拉正是通过“深夜AI接力”收割了夜间订单,使数字人GMV贡献率稳定提升。如今,京东言犀数字人也正从闲时走向忙时,不仅承接夜晚等闲时的流量转化,更成为不少品牌直播间的“常驻员工”。

第三是交互与脚本进化,数字人已经会“尬聊”和“抖包袱”。并且近期京东言犀数字人宣布接入DeepSeek,支持AI辅助生成直播脚本,话术更加多样甚至富有幽默感。

目前已有200余家品牌正在使用DeepSeek辅助生成数字人直播脚本,文案参考率高达90%。

很明显,大模型的融入让数字人不再只是机械播报,也能够根据用户提问灵活回复,提升用户的驻留时长和转化机会。

当数字人技术从“噱头”变成“常态工具”,其应用前景也不再局限于直播、电商。

从京东言犀数字人的场景应用推广来看,数字人不仅是商业工具,也逐渐开始延伸到政务、文旅、非遗保护、线下导购、数字资产管理等更广阔领域。

在政务场合,数字人可以用来做应急播报、政务大厅咨询;

在文旅和非遗保护中,数字人可以做导游讲解,或将少数民族歌手或传统艺人的形象、唱腔长久留存;

在金融服务里,数字人可承担部分“柜台”工作,7×24小时解答复杂业务。

展望未来,当多模态大模型与数字人深度融合,当实时互动、千人千面与场景深耕进一步成熟,数字人将不仅在“降本增效”上抢占先机,还可能开启全新的消费方式、娱乐方式与社会交互形态。

正如京东言犀相关负责人所言,一旦数字人进入“千人千面”“24小时随时响应”的时代,这种人机交互新形态会“像智能手机一样普及”,给社会带来更多想象空间。

从2024年4月“采销东哥”AI数字人直播的轰动,到如今超9000家品牌拥抱京东言犀数字人,实现了大幅增长,短短一年多时间,数字人已成为直播行业乃至零售数字化的新引擎。

这背后源自京东云在人工智能上的持续投入,以及多模态交互、生成式AI突破带来的集成效应,也离不开市场对“高效带货、降本增效”的强烈需求。

当数字人不再只是实验室里的炫酷Demo,而能在品牌商家直播、政务、文旅、金融等多个场景落地、创造价值时,它才真正跨越了“恐怖谷”和商业鸿沟。

或许再过几年,我们会发现,数字人直播不再是“特殊场景”,而是与真人同台、甚至千人千面、场景无限延伸的标配形态。

每一家企业、每一个品牌、甚至每一个普通用户,都能拥有自己的人性化“AI分身”,去完成更多样化、更智慧化的交互和创造。

在跨越“恐怖谷”后,数字人对产业和社会的改变,才刚刚开始。

来源:亿欧网

相关推荐