京东大模型:加速深度思考,铺开产业级应用

B站影视 韩国电影 2025-05-21 17:53 1

摘要:近日,京东全新推出750B深度思考大模型、行业首批高商业可用数字人,并发布了角色智能体与具身智能融合的最新进展,展示出AI认知能力与商业应用的最近进展。

近日,京东全新推出750B深度思考大模型、行业首批高商业可用数字人,并发布了角色智能体与具身智能融合的最新进展,展示出AI认知能力与商业应用的最近进展。

“大模型的能力光谱在变、参数尺寸在变,不变的是让产业用好大模型。只有深耕产业,让大模型在产业里跑起来,才是最有价值的事情。”京东集团探索研究院副院长、京东科技人工智能业务部总裁何晓冬表示。

技术拓宽大模型能力边界,支持企业构建专有模型

在AI进化的“马拉松”中,京东大模型展现出了独特的产业基因。

目前,京东已经具备全尺寸大模型,满足多样化的产业需求:3B和10B模型可提供极致响应效率;81B主力模型可兼顾效果和性能。最新推出的750B超大规模模型,则兼具“深度思考”和“非深度思考”双通道能力,能满足各行业对“即时响应”和“深度推理”的双重需求。

具体来说,750B超大规模模型在训练过程中,使用了动态分层蒸馏、跨领域数据治理等京东创新技术,降低大模型的训练和部署成本他,同时兼顾大模型效果,保证大模型能力“大而精”。

举例来说,在客服场景需要模型快速响应,能自动启用轻量化推理路径,实现毫秒级反馈;在供应链优化、医疗诊断等场景需要复杂决策,则启动深度思考模式,依托1280K的超长上下文窗口,能完成多维度信息的关联与逻辑推演,在长文本1280K“大海捞针”评测中,实现接近100%的准确率。

在大模型开发计算技术层面,京东探索研究院相关论文近期发表于Nature旗下期刊,在国内首次系统性地解决了“开放环境下大模型开发效率”的难题。该研究提出四大核心创新方法:模型蒸馏、数据治理、训练优化与云边协同,将大模型推理效率平均提升30%,训练成本降低70%,形成了一套可复用的产业级技术范式。

这些技术研究支撑了京东JoyBuild大模型开发计算平台,可提供超过100种算法和工具链,帮助企业根据业务需要,将通用模型快速转化为专业模型,实现大模型一站式应用。

数字人实现高商业可用,618面向商家全免费

在大模型“硬实力”的支撑下,数字人等“软实力”应用,也迅速实现了商业化可用。

基于通用数字人大模型2.0,京东推出高商业可用数字人,支持精品音色微调、精确声唇对齐,能适配各种品类的主播人设、表达出情感丰富的音色韵律、实现自然拟人的大姿态动作,让数字人表现力更丰富、带货更高效。

今年京东618期间,基于京东云的技术支持,京东数字人更推出六大行业定制数字人,包括赛博先锋、国风达人、运动少女、成熟型男、青春男大、职场丽人。这些数字人人设能匹配各品类商家的行业需求,驾驭3C数码评测、高奢走秀、美妆试妆、零食吃播等特色直播场景,此次免费开放给京东商家使用,让商家带货更轻松。

举例来说,知名休闲零食品牌三只松鼠就与京东数字人深度合作,打造了绿色健康主题的AI直播间,并为三只松鼠平台合伙人“鼠阿秀”定制了专属直播形象。其直播间即使在凌晨流量低谷时段,也能实现GMV高产出,已经累计带动超千万元销售额。

Joy Inside走向物理世界,开启具身智能新篇章

驾驭了数字世界的商业应用,京东大模型还通过Joy Inside探索走向物理世界,让机器人向“人格化”演进。

基于京东日均超千万次智能对话沉淀,京东Joy Inside可将京东角色大模型驱动的对话智能体,植入机器人、机器狗、AI玩具等硬件中,为硬件赋予灵魂和情感,与用户建立情绪连接。京东Joy Inside具备海量知识、高情商、言行一致、长期记忆等特性,正部署在越来越多硬件中,走进更多用户的日常生活。

来源:中国商界杂志社一点号

相关推荐