摘要:DeepSeek-R1彻底打开了强化学习的“黑匣子”,也撕下了以OpenAI为代表的闭源大模型“遮羞布”。一场假期逐渐演变为了DeepSeek式“扫盲”,普通人占卜问道,圈内人连夜恶补论文。
AI圈春节无眠,DeepSeek凭借一己之力在国内外掀起了腥风血雨。
DeepSeek-R1彻底打开了强化学习的“黑匣子”,也撕下了以OpenAI为代表的闭源大模型“遮羞布”。一场假期逐渐演变为了DeepSeek式“扫盲”,普通人占卜问道,圈内人连夜恶补论文。
仅上线20天的“DeepSeek”创下了奇迹,全球日活DAU突破2000万,成为了全球增速最快的AI应用。
目前,大模型行业存在着两条并行主线,即底座大模型能力升级与Agent应用落地。前者主要解决的是天花板问题,模型通用能力越强,所能处理的问题就越复杂。Agent则承担起连接“大模型”和“场景”的中介作用,核心解决的是模型落地问题。
DeepSeek不仅是模型性能大突破,而且带来了高效、节约成本的开源解决方案,这将为今年Agent应用爆发打下了基础。据悉,仅春节期间,就有部分企业完成了全线产品基座升级,迎来了第一批“DeepSeek应用”。
底层大模型是“打地基”,Agent应用是“盖房子”,地基打得牢,房子才能建得稳。
据光子星球了解,在大模型这片算不上成熟的土壤上,Agent至少已经抢跑了一年多。当Agent从工具属性逐渐演变为生产力,能够把大模型能力打包进产品来解决问题,所有的SaaS都值得用AI再做一遍,都值得用智能体改造一遍。
历史似乎是一个循环,仿佛一夜回到当初的大模型井喷期。面对Agent,是要以量取胜,走“千体大战”“万体大战”的路线,还是聚焦到核心需求场景,集中把几个场景做深、打通?
大模型的下一站:Agent在大爆发前夜过去一两年的时间,大家各自沿着技术、场景进行摸索。Agent作为一个新兴业态,目前整体呈现出“混沌”的阶段性特征。
最直观体现在价格上,翻看过去一年的Agent应用订单,成单价格在几千到上千万元浮动,弹性相当大。相关行业人士告诉我们,某些个人开发者可以把价格压得很低。
一个比较突出的点在于,Agent的落地是先供给后需求。以技术为导向的思维下,导致了Agent早期对外输出时更多强调的还是“工具属性”。对一般企业来说,有两个门槛,一是在大模型之上调动工具组合Agent应用的能力,二是把Agent应用与现有业务结合的能力。
目前国内尚有大量的大型、中小型企业用户需求没有被释放与满足,整个市场供给出现了断档。有一部分企业敏锐地察觉到了该现象,试图扭转供需间的失衡关系,但仍是杯水车薪。囿于自身资源、实力有限,不能完全覆盖刚需场景,以此来满足企业的需求。
需求和供给是一组动态的关系,初期由技术驱动,随着技术的成熟,Agent应用需求爆发近在咫尺。
回顾大模型的发展也曾走过同样的轨迹,从无到有,从搞大参数到百模大战。比起大模型,Agent的部署难度系数更低,像此前一样,也出现了极端化的声音。有企业家说要做百万个Agent应用,开展智能体时代的“千体大战”和“万体大战”。
对此种观点,持正反两方观点。支持的人认为,现下Agent还有大量需求没被发现,只有迅速以数量铺开,通过大规模的开发与应用,才能让Agent触角深入到各个行业,测试效果如何。
反对者则认为,借鉴大模型,百模大浪淘沙后也只剩几家,Agent没有必要做无谓资源浪费,不如先聚焦在几个刚需场景。比起“用上”,“用好”才是终极目标。
让AI更有用:聚焦五大场景做深做透“发展智能体,做深比做多更重要。”
京东云是几家坚持Agent市场大有可为的大厂之一,基于海外SaaS市场的成功经验,一位京东云人士认为发展智能体也要用好技术的二八定律——20%核心应用往往满足了通用的80%需求。
考虑到Agent目前的发展阶段,京东云认为做深比做多更重要,要把核心场景打穿、打通,将20%核心应用做到“好用易用”。
因此,京东云构建了一套完整的智能体技术体系,简单来说就是两个词“AI应用更有用”和“AI应用更好用”,并以此形成了可以提供从底层智算到上层应用的一揽子系统解决方案。
具体来看,向上是场景层面,基于京东内部智能体实战经验,严选出企业布局智能体聚焦的五个重点方向,分别为协同办公、专业助手、客户服务、营销推广和数据应用。
向下是基础设施层面,避免出现传统SaaS重复造轮子所导致的孤岛效应和资源浪费,京东云认为企业应该打造统一智算底座。通过智能体平台配置好的模板,降低用户使用门槛,帮助业务侧快速搭建满足80%核心需求的智能体应用。
京东云聚焦五大场景的考量主要有两个。首先,从外部调研数据看,Agent广泛应用在软件开发、市场营销、IT运营、客户服务、人力资源等场景,其所选取场景基本覆盖了市场企业的需求。
另据京东云数据显示,五个重点方向目前覆盖了智能体收益最高的80%核心场景。这样一来,客户不仅知道把Agent用在哪里,还知道怎么拿Agent赚钱。只有用户清晰地看到收益,才能更快地释放Agent应用市场需求。
落实到Agent应用场景是个模糊的概念,有些新兴的Agent公司被迫定位为“工具型”产品,原因就在于缺乏行业经验。
有公司告诉光子星球,他们只有在保证通用型产品的基础上,才能抽出精力选择性地满足客户的业务性需求,一旦超出他们的可控范围,就不得不放弃某些场景。
但京东本身就是Agent的最佳试炼场,五大场景就是跑通物流、金融、零售等业务的实战结果。
据其介绍,基于京东云言犀智能体平台,京东内部已构建超1万+个智能体,提高人效超1亿元。基于此,才有了对Agent应用场景的进一步细分,例如对笼统的“专业助手”划分为商家智能助手、采销助手、物流小哥智能助手等。针对营销推广需求细化为了AIGC营销、AI导购、数字人直播、智能外呼等。
从场景直接切入到行业,客户立即就能锁定应该用到哪些业务环节中。据悉,京东云言犀智能体平台配置100多种行业解决方案,以及1000多种插件,无论用户是否有编程基础,都可以低成本快速搭建基于AI大模型的各类智能体应用。
将AI Agents部署到生产环境中时常面临着定制化难度大、缺乏可重用的基础设施等问题。众所周知,Agent最突出的能力在于可调用工具,但碎片化的工具、集成性和可扩展性问题一直困扰着企业和开发者。这就需要建立管道和调度属性的平台来统一管理。
言犀智能体平台,是京东云推出的一站式AI智能体搭建与发布平台,旨在连接大模型与企业应用的“最后一公里”。
(言犀智能体平台架构图)
该平台最底部是模型开发平台,目前已经接入了数十个大模型,用户可根据实际的业务需求选择合适的大模型。中间是Agent应用构建平台,可以任意组合大模型、知识库、插件、意图识别等能力,通过流程编排的方式来增强AI Agent对流程型复杂任务的理解和执行力。最上面接入了企业核心场景,用户只需要简单复制行业模版和简单调试即可快速构建智能体。
上文中提到,业务量的参差不齐导致了用户需求量的差异性。针对此,京东云不仅在开发过程中同时兼具灵活性和便捷性,而且在交付模式上覆盖了大、中、小型各类企业需求,也无需纠结于通用化还是定制化功能。
首先是公有云服务模式,适合深度开发行业模型或独立模型部署的场景,无数据外网担忧,直接使用公有云言犀SaaS服务,资源弹性,按量付费。
其次是私有化交付模式,满足数据本地化管控要求或低延迟指标需求,适合深度开发基础模型、行业模型或独立模型部署的场景。
第三是联合定制开发,由京东云与行业客户或行业软件开发商共创,京东云提供算法服务和交付平台,行业开发商借助言犀智能体平台开发应用。
重塑AI生产力:Agent已深度融入业务全流程现在,被京东验证过的Agent能力正在被大量复制,在各行各业的公司内部发生化学反应。
刘晔(化名)是一名跨境电商,每天都要处理来自各个国家的商品货物,商品进出口时的货物备案成为了其最头疼的一环。传统HS Code备案流程复杂、耗时久、易出错,需要先核对产品信息、判断商品种类,翻阅资料查找税则号后,然后手动上传备案。遇到不常见或复杂商品时,商家还需要重复沟通、确认。每天繁琐又重复的步骤,让刘晔在其中消耗了大量的时间。
在接触到京东云的CMS HScode生成智能体后,他开始尝试让AI替代人力。“现在一步就能完成备案流程,算下来只用了5秒钟”,刘晔惊喜于Agent带来的高效。现在,他每天只需要点击“AI推荐”按钮,智能体工作流就会被触发,大模型自动根据输入的商品名称进行品类识别,精准推荐出对应的海关编码,在被其采纳后,还能同步关联出编码下的相关审核信息。
京东云称,目前已有600多家京东跨境商家体验到了该智能体的便捷,日均调用次数超过3000次,最高达5282次,商家采纳率高达84%。
在广告投放场景上,京东云推出了京准通智能助手,实现了“一鱼多吃”。一个Agent应用解决了许多商家专业知识不足、创意制作难题、操作效率低下和数据分析困难的四大难题。
“一个人也可以是一个广告投放团队。”
例如,商家往往难以获取行业内的最佳投放实践经验,不知道如何根据不同的产品和目标受众进行精准投放。京准通智能助手作为AI优化师,能结合专业投手的最佳实践,提升广告创建与优化效率,让商家能够借鉴专业经验,提高投放的精准度和效率。
制作吸引人的广告文案和图片素材需要耗费大量时间和精力,对于人力和资源有限的商家来说是一个巨大的负担。京准通智能助手的AI设计师功能,可帮商家一键制作广告文案和图片素材,快速生成高质量的创意内容。
一个真实的案例发生在去年京东618大促期间,惠普品牌在推广某款游戏本时尝试使用智能助手来辅助广告投放,得益于其数据查询和分析能力,帮助品牌降低20%多的人工操作耗时。
合同审核几乎成为了Agent落地的必选项,无论央国企还是私企每天都产生了大量的需求。看似简单的功能,实则每个流程都对AI造成了挑战。
文本往往具有高度的专业性和严谨性,充斥着大量的法律术语、行业惯例和复杂的条款结构。AI要准确理解合同内容,不仅需要具备强大的自然语言处理能力,还需要深入了解法律、商业等多个领域的知识。
例如,合同中的一些模糊表述,如“合理期限”与“不可抗力”,其含义在不同的情境下解释各异,AI需要结合上下文和相关法律规定进行准确判断。此外,合同条款之间存在着复杂的逻辑关系,如条件关系、因果关系等,AI要能够识别并理解这些关系,才能准确评估合同的风险和合规性。
为了解决上述问题,京东的JoyLaw智能体应用采用“小模型+大模型+工程”组合的审查模式,通过大模型的语言理解能力对合同文本进行初步分析,再利用小模型针对特定领域和业务场景进行精细化处理,结合工程优化手段,显著提升了审查结果的准确性,准确率超过85%。整个审查过程最快低至2分钟内,极大地提升了效率。
终DeepSeek以其媲美OpenAI领先模型的效果和极大的成本降低,给AI应用带来更大的想象力。据测算,DeepSeek-R1的整体成本,约为OpenAI o1模型的1/30,让人们可以用极低的成本应用AI。
此前,京东云已经正式上线DeepSeek-R1和DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式,供用户按需部署,快速调用。
随着大模型技术的飞速演进和成本的极大降低,有观点认为,2025年将成为Agent大规模落地元年。一旦Agent的“千体大战”“万体大战”爆发,Agent应用难免走向同质化的命运。
跳出“题海战术”,包括京东云在内的很多玩家都认为,Agent的差异性不在技术上,而在场景与业务落地。
当Agent真正成为生产力,其标准也随之变得透明化,回归到“降本增效”的本质上。站在用户侧,则体现为Agent搭建上手速度越快越好;企业需要自己定制化的比例越低越好;为企业带来的增效越明显越好。
京东具备丰富供应链场景和数据,能够为大模型应用生长提供肥沃土壤。我们了解到,活跃在其内部的智能体超10000个,覆盖了智能客服、物流运输、合同审核、研发效能等场景。
测试数据证明,Agent已经带来了明显的提效。AI场景的探索落地,从3个月缩短到1周,之前需要10余人的科学家团队工作,现在1人即可完成。新应用的开发上线,从以前几个月时间,只能做一个应用,到现在每个月可生产上千个应用。
早先,“采销东哥”出圈,商家们正是看到京东自己“用得好”,才选用言犀数字人解决方案一样,对于客户而言,他们所需要的Agent不是花里胡哨的营销,而是要一把经过实际验证有效的产品。
来源:新浪财经