不再辨真假,数字人直播进入Next Level

B站影视 内地电影 2025-03-31 20:46 1

摘要:很快,直播间再次恢复了直播,主播是巴拉巴拉的“直播推荐官”小佳。她身着白色连衣裙,开始讲解起货架里的商品。期间有用户进入直播间,小佳说,“欢迎这位朋友,喜欢就分享,更多人一起来领福利。”很快,聊天框显示这位用户拍下了一件衣服。夜已深,小佳化着淡妆的脸上看不到一

文丨邬宇琛

编辑丨周近屿

午夜零点,童装品牌巴拉巴拉京东直播间的主播结束了最后一轮商品讲解,从屏幕里消失。

很快,直播间再次恢复了直播,主播是巴拉巴拉的“直播推荐官”小佳。她身着白色连衣裙,开始讲解起货架里的商品。期间有用户进入直播间,小佳说,“欢迎这位朋友,喜欢就分享,更多人一起来领福利。”很快,聊天框显示这位用户拍下了一件衣服。夜已深,小佳化着淡妆的脸上看不到一丝倦意。

这一切交易都在商家和真人主播的睡梦中完成——承担深夜销售任务的主播小佳,那个态度亲切的“直播推荐官”,实际上是京东言犀数字人。这样的场景已成为巴拉巴拉深夜直播间的日常,现在,巴拉巴拉直播间闲时成交额占比约为全天GMV的15%。

过去一年,借助京东言犀数字人技术,许多商家得以承接午夜等闲时流量,挖掘增量价值,平均闲时直播转化率高达30%。如今,得益于京东云技术支持,言犀数字人正逐渐走向忙时,数据显示,言犀数字人已走进9000+品牌直播间,累计为商家带来销售增量超140亿。

而就在不久前的3月19日,京东凭借言犀数字人项目获得中国智能科技最高奖——吴文俊人工智能科学技术奖特等奖,这也是本年度唯一的特等奖。这场在直播间悄然发生的革命,正在以低成本、高转化等特性重塑行业格局。

2019年,少侠(化名)和一家品牌在某平台合作直播时,用20天就卖了近亿元,“怎么可能这么猛?”连少侠自己也被惊愕。那是直播电商的黄金时期,直播间像是个活火山,站在补光灯后面,他目视着GMV伴随“321上链接”的叫喊声无法克制地喷涌。

从2011年进入电商行业,到2017年开始创业,做电商品牌代运营公司,少侠几乎见证了中国电商直播的整个变迁曲线。

2016年,京东、淘宝等入局直播电商,揭开行业爆发式增长的序幕。在当时,直播间还只是商品展示的延伸渠道,是内容营销的一种方式。随着头部主播的影响力逐渐凸显,达人直播的模式一度作为主流的直播模式之一为品牌方青睐。

那是直播电商行业的上半场——财富在弥漫,但行业的竞争也迅速变得激烈。直播行业里的冲锋陷阵的角色——主播,作为直播行业最大的亮点,也同时成为了最大的痛点。“在平台做电商直播投流,必须在三、四个小时里面高频输出、接住流量,如果没接住,运营、品牌、公司都会骂你,心理压力特别大,”少侠说。

一个主播,需要配合选品、脚本策划、内容预热、设备调试等环节,面对工作的时间,远不止对着镜头那三、四个小时。据《中国网络视听发展研究报告(2024)》,职业网络主播的日均工作时长普遍超过10小时。

高强度的工作无法保证主播能在每场直播都表现稳定和出彩,这将影响直播间的转化率。真人主播也没办法保证24小时工作,这意味着夜间很大一块的闲时流量成为了品牌方们无法攻占的阵地。最关键的是,每个主播都在为钱燃烧青春,但青春燃尽后,主播们要往哪里去呢?

那时他或许也没想到,直播电商行业很快就迎来了中场。

头部主播们接二连三的“翻车”引发品牌方们对头部主播的怀疑,而更大的问题是,只注重短期冲量,倚靠压价内卷而换取利润的策略已经让品牌方们身心俱疲。各个直播平台都开始重新洗牌,有意让直播电商“去个人化”。

也就是在这时,京东言犀数字人开始上场了。

● 巴拉巴拉直播间的灵犀数字人小佳。图源:直播间截图

童装品牌巴拉巴拉从2024年3月开始引入京东言犀数字人服务,当时,管理层一致认为,因为主播的精力有限,错失夜间流量是巴拉巴拉京东电商直播为数不多的瓶颈。

作为一款基于多模态大模型的AI营销产品,京东言犀数字人能够个性化定制,像真人一样进行语音交流、情感表达和智能互动,可以用于直播带货、客服咨询和品牌宣传等多个场景。

一个月后,京东言犀数字人服务在巴拉巴拉的京东直播间上线,工作时间是0点到第二天8点。过去,巴拉巴拉的真人主播在一些大促的节点会熬到凌晨2点,已经到身体的极限了。

效果立竿见影,引入京东言犀数字人后,巴拉巴拉京东直播间的数字人直播时长占比已经达到近50%,AI销售业绩在一天中的占比从早期的5%逐渐提升到15%。不仅如此,直播团队的成本也在降低。

而据少侠初步推算,对于大多数品牌来说,京东言犀数字人的引入每年至少可以省下30-40万元的成本。京东言犀则表示,已将单个数字人生产成本大幅拉低,较真人拍摄模式成本降幅超90%。

巴拉巴拉直播业务负责人兰朵朵说,数字人对于商家几乎有普遍价值和意义:京东言犀数字人可以填补夜间等流量的空缺,降低直播成本,解放更多人力投入到其他业务的运营。在京东平台上,数字人直播还能够获得公域流量支持。而对中小品牌,在招主播比较困难的情况下,京东言犀数字人也可以帮助他们低成本进入直播行业。

在直播电商的中场,数字人走上场,它象征着降本增效,迎接正在转变的直播电商形势,以及愈发明朗的技术趋势。

现在,当我们看一个京东言犀数字人,会感叹它的自然和真实:它的面部表情会变化,会传达肢体语言,语气中有态度和情感的起伏,甚至还有光影的变化。但回到三年前,数字人面部稍微动一下,嘴唇就会少半边。

在心理学上,“恐怖谷”指的是拟人的机器人会给人类带来一定的恐怖心理,有一点点的不真实都会给人类带来不舒适的感受。而当拟人度接近真实,人类就会跨过“恐怖谷”,反而开始接受它——京东言犀数字人就始于这样的挑战。

2022年左右,京东言犀团队在接连攻克了人工智能的文本交互、和语音对话之后,开始朝更加复杂的实时交互方向迈进。而数字人刚好就在多模态大模型的技术方向上。按照京东言犀数字人项目算法负责人的话说,“这是顺其自然的推进”。

但这并不简单。

一个鲜活的京东言犀数字人需要至少三种核心人工智能模型支撑。首先,语音TTS模型负责将文本转化为自然流畅的语音。其次,言犀大语言模型赋予数字人强大的语言理解与生成能力,使其具备智能对话能力。最后,通过数字人大模型驱动数字人形象,确保数字人的面部表情、口型和动作与语音高度同步,实现逼真的视觉呈现。

在当时来看,许多技术细节几乎是被认为难以实现的。“沮丧是常态”,这位负责人说。单以TTS模型为例,当下京东言犀的TTS模型是在20多万小时高质量的数据上训练出来的,这些数据构建不仅是体力活,还是脑力活。

再比如姿态的表现上,他记得,团队当时遇到的第一个难题是,做好了一个正面的数字人形象之后,却无法让这个数字人在场景内走动起来,在这种情况下,团队要么把模型结构改了,要么就是改变模型的训练策略——解决这个问题,团队花了大概2个月的时间。

探索是循序渐进的。起初,京东言犀数字人基于单一人物模型实现实时交互,比如根据一段模特的三十分钟甚至更长时间的素材训练数据,生成数字人形象。后来,京东言犀团队基本构建起了“端到端”的核心技术思路,即通过大模型的技术路线,采用一个通用模型和一小段更精简的素材训练,就可以对任何人物形象进行动作和表情的驱动——这一过程里,建模、驱动、渲染都是一体化的。

他们很清楚,京东言犀要做的一定不是实验室产品,而是工业化产品,它必须是能在严肃的商业场景里被选择和广泛应用的。因此,京东言犀数字人优化和突破的重点被放在,更低的信息输入、更逼真表现力和更高的转化上。

有很长一段时间,京东言犀团队都在和时间战斗:倘若当下要依靠30分钟的真人模特素材训练,那么下一个目标就是20分钟,再下一个目标是10分钟,直到1分钟。同时,随着算法升级,幻觉率也逐渐降到“极低”,京东言犀数字人越来越靠近真人。

● 京东各行业的AI数字人。

而作为一个全自动化的“端到端”产品,京东言犀数字人技术也同时实现了成本的降低。在这一系列的酝酿之后,京东言犀数字人终于走向了公众的视线。

2024年,4月16日,刘强东的采销东哥AI数字人出现在京东采销直播间,引爆全网讨论。2个月后的“京东618”,京东集结了21位总裁数字人直播,同期开播的还有超过7500家品牌商家,开启了行业内数字人的大规模实践。去年11.11、年货节等场景,数字人与个护美妆、家电家居、母婴宠物等品牌产生化学反应,持续提升直播交互体验。

京东言犀数字人就此持续大规模铺开商业化,登上直播电商新阶段的历史舞台。

当人们看见京东言犀数字人自然地眨眼、挥手、走动、讲解产品,再也不觉诡异,短短这一瞬,却是技术突破和创新的三年。

不难看出,在京东言犀数字人的研发过程里,团队有一条清晰的主线,就是围绕着产业应用去做技术突破。按照京东言犀团队的话,“在产品上不能妥协,在技术上要持续进步”。

相比于很多电商场景,电商直播间更加复杂,落地难度更大,但恰恰是这一场景,让数字人和产业的结合更加密切,更能体现产业价值。

这样的共识推动京东言犀数字人在研发阶段就朝着更加应用价值导向的道路迈进。自媒体《浅黑科技》写过这样一个故事:言犀数字人产品团队为了让言犀数字人更加拟人,曾整天看直播,观察真人主播吸引观众的关键姿态。最后他们发现,真人主播的“小动作”恰恰是能体现“主播感”的东西,比如直播过程中喝口水,撩撩头发。这些细节后来都在言犀数字人的迭代中被优化。

● 2024年9月,北京服贸会,京东展台数字人。图源:视觉中国

某种程度上,在产业扎根也是一种战略。京东在大模型赛道先进入,再优化,选择通过言犀数字人这样低成本、高转化的轻量化产品作为探索大模型应用的起点,可以让京东以简单、快速的方式累积经验,从而更深入地拓宽数智服务的可能性。

比如在大规模推广商用以后,京东言犀团队就不断根据商家的反馈和建议优化数字人。去年7月发布的言犀数字人3.0平台,更新了100+的个性化角色和50+行业特定属性场景,实现零配置下覆盖90%的常见问询,商品推荐应答准确率超90%。

到今年2月,京东言犀数字人还接入了DeepSeek R1/V3模型,使其文本内容丰富度进一步增强。今年,言犀团队还计划推出“千人千面”的数字人,基于用户喜好进行个性化交互。

“早期的数字人相对来说还是比较像机器人的,现在形象也是越来越逼真,和消费者互动也越来越智能。”巴拉巴拉直播业务负责人兰朵朵说。

而除了直播间,京东言犀数字人也开始服务更多的场景。去年4月,京东云打造的“花木兰”数字人正式“入职”山西大同文旅,她不仅能如数家珍地介绍当地名胜古迹,还能用中英文双语向全球游客推介大同。在金融领域,京东的金融服务数字人已累计为超500万用户提供服务,满意度超过90%。

如今,每个深夜,京东的采销直播间依然灯火通明。真人主播的麦克风静音之后,京东言犀数字人准时“上岗”,用不知疲倦的声音继续直播:“抓紧时间下单哦,有问题随时问主播!”

在人工智能产业应用加速落地的关键时期,京东正通过引入全球顶尖人才深化其技术护城河,继京东科技宣布2025年将实现全员平均20薪后,又传出算法团队全员加薪至少30%,这不仅刷新行业薪酬标准,更凸显出对核心技术人才的战略倾斜。京东正在人才引入和培养上持续加码,扩大在人工智能产业应用方面的优势。

来源:中部城市群

相关推荐