智能体不是狂欢是硬仗,企业要先迈过这“三道坎”

B站影视 内地电影 2025-06-06 18:30 2

摘要:“轻量定制行业智能体,正在成为大模型产业落地的最快路径。”百度集团执行副总裁、百度智能云事业群总裁沈抖,在6月6日百度智能云与人民日报合办的2025智能经济论坛上提到,要真正把AI用到产业深水区,就必须走行业化这一步。

做好智能体应用,最核心的就三个问题:怎么开发、选什么模型、用什么算力。

文|周享玥 赵艳秋

编|石兆

“轻量定制行业智能体,正在成为大模型产业落地的最快路径。”百度集团执行副总裁、百度智能云事业群总裁沈抖,在6月6日百度智能云与人民日报合办的2025智能经济论坛上提到,要真正把AI用到产业深水区,就必须走行业化这一步。

今年被视为智能体落地元年与爆发年,企业纷纷开展应用探索。但业界发现,智能体作为复杂的系统,在市面上秀起来酷炫,一旦被引入企业真实业务场景则效果欠佳甚至翻车。如何避免智能体沦为一场技术狂欢的秀场,目前业界正合力探索行业智能体落地路径。

论坛上,包括交通银行、中国中车、国家电网、山东港、广东交通集团、 山东重工、南方电网等央国企和行业龙头,围绕大模型应用和智能体落地等核心问题展开分享探讨。百度智能云则从做好智能体应用最核心的三个问题——开发、模型、算力进行了剖析。

01

智能体落地,从通用宽泛走向垂类场景

2025年,被认为是智能体落地的元年,同时也是爆发年。短短几个月内,业界进行了大量探索。数智前线观察到,尤其一些大型企业,规划智能体建设,往往都是按成百上千的数量级在做。

IDC预测,Agent中国市场规模预计将突破300亿美元。Gartner数据则显示,到2028年,至少15%的日常工作决策将通过AI智能体自主做出,1/3的企业级软件应用当中都会包含智能体

但繁荣背后,企业级智能体的落地仍然面临不少难题和挑战。

“尝鲜期过后,企业客户不再只为技术买单,而是明确要求智能体必须带来可衡量的业务成果(ROI),推动定制化需求。”IDC中国高级分析师杨雯告诉数智前线。

企业目前最关注的Top 3问题中,除了任务闭环可靠性,即复杂任务能自主规划、执行、纠错直至完成,还包括数据安全与合规性,以及定制化微调的成本与效率,即能否以合理成本、高效地将智能体适配到企业独特业务和知识上,因为这决定了智能体能否真正落地和发挥价值。

智能体并不能只是一个宽泛的落地,而是要结合具体场景,去实现具体的业务价值。

智能办公、文档总结、审批等通用场景,智能体开发难度相对较低,目前已在多个行业中有落地,比如一些企业仅在行政场景就落地了10个智能体,但同时,其带来的整体价值厚度也相对有限。

与通用场景智能体不同,另一类与业务场景强相关的智能体,如同企业的“业务专家”,价值高潜,但落地门槛极高,不仅需要掌握先进的大模型和技术平台能力,还需将行业经验和业务逻辑提炼并转化为相应的规约模板、提示词或执行操作步骤,预设到智能体中。

这也是目前企业方和各头部服务商正在加速攻克和布局的方向。在这个过程中,“‘零号客户’是现在大家非常关注的。”Gartner研究副总裁孙志勇说,行业经验,将成为智能体落地竞争中的胜负手。

在本次论坛上,百度与行业龙头共同推出了“百度智能云精选⾏业场景智能体家族”。沈抖介绍,在此基础上,企业只需进行一些轻量定制,就可以快速将这些能力应用到自己的业务系统中

这些行业场景智能体家族,深入到了行业和具体的场景中。

比如面向能源行业的营销供电方案智能体,由百度智能云和国家电网联合打造,主要针对电力公司日常工作中最为常见的,因用户的海量用电需求而需编制成千上万份供电方案的场景。

过去,光是业务受理环节就要填报大量数据和资质证照,制定方案时要多个部门现场勘查,耗时长、效率低,成本高。现在,在前期业务受理环节,智能体通过多轮对话就可以精准识别用户办电需求,利用大模型能力自动生成多套供电方案,还能针对不同偏好的用户动态调整方案优先级,帮用户对比不同方案的优劣,辅助企业做出最优选择。目前,这套流程、知识和工具都已被沉淀下来,可以快速复制到更多的电网系统。

生态环境监测智能体,则能对接环境监测总站所有多源环境质量监测数据,面对复杂的气候条件,不仅能灵活查询环境质量状况,生成质量分析报告,还可以给出精准预测。这个智能体,已经在中国环境监测总站落地,在空气质量问答、污染源答疑等多个场景下回答准确率超过95%。

“未来,我们还会沉淀更多的行业智能体,赋能更多业务场景。”沈抖表示。

02

要做好智能体应用,需解决哪些核心问题?

虽然业界认为,智能体已从概念验证阶段迈向规模化应用初期,开始走出实验室和单个试点项目,进入核心业务流程,但目前能在企业生产环境应用的智能体并不多。因为这背后,往往是一套复杂的系统。

“要做好智能体应用,最核心的问题有三个:怎么开发、选什么模型、用什么算力。 ”沈抖说。这意味着,智能体落地涉及全栈能力。

在如何开发问题上,往往涉及到“一大堆工程”:

比如,它得结合企业的私域数据、企业知识库,让Agent学习企业多年沉淀的行业经验,实现业务需求与技术的对齐。再如,很多企业有自己SOP(标准作业流程),不能让大模型自己发挥,需要根据企业规范编排业务流程、执行任务。如果涉及多个智能体协同,还需解决精度问题。

一位应用商举例,三个80%精度的智能体简单相加,精度可能仅为51%,难以满足准确性需求。此外,智能体还需要调用各种工具,满足企业级服务所需的安全性、稳定性和可控性。

在整个过程中,又涉及大量的开发,用到不同的开发架构、编排体系,要涉及到MCP(调用接口)的方式。

针对这一块市场痛点,多家头部大模型厂商都在通过打造一个便捷、好用的智能体开发平台,降低企业级智能体开发门槛。

百度智能云在千帆大模型平台上,提供了Agent 开发、管理所需的全套工具链。企业能快速开发自己的Agents,利用MCP服务激活IT和数据资产,也可以直接使用百度提供的成熟Agents,并在千帆上去持续优化这些Agents。目前,千帆平台累计帮助用户精调了 3.3 万个大模型,开发出 100 多万个企业级应用。

在模型的选择上,业内人士介绍,智能体可以根据不同场景,选择合适的通用大模型、行业大模型,以及小模型,并给出最佳的协作方式。

业界正在不断增强通用大模型的能力,尤其是在推理、多模态方面的能力,以此提升智能体走向更复杂场景和精细化任务时的落地效果。今年4月,百度全新发布的两款旗舰模型:文心4.5 Turbo和 X1 Turbo,就大幅提升了多模态感知与推理能力。

通用大模型之外,当下行业里另一个热烈讨论的话题是,到底要不要开发行业大模型?

一些企业认为,行业大模型训练成本、门槛都比较高,未必是一个最有效的手段。尤其目前通用大模型每周都有更新,很多企业会担心,自己训练的行业模型会不会打了水漂。

不过,一些深入到企业垂类场景的智能体,确实需要更专业的行业大模型支撑。是否训练行业大模型边界在哪里?“像药物研发,数据由专家标注,通用大模型的能力很难达到。而在工业场景下,如果没有触达到工艺机理深度,行业大模型可以先不着急做。”一位行业人士表示。

在本次论坛上,百度智能云宣布以金融行业为试点,正式推出千帆金融行业大模型——千帆慧金。

百度相关人士告诉数智前线,大模型应用到金融场景,常常会遇到两大挑战:

一方面,金融行业的知识面广、时效性强,对大模型的准确性有严格要求,需要行业基础知识的增强。另一方面,金融行业也有诸如财报或研报的表格分析、房贷利率计算等场景,需要进行推理增强。推理是今年金融行业重点的一个方向。5月,工银科技有限公司副总经理侯志荣透露,从今年开始,工商银行的企业级大模型的一个重要方向是金融推理大模型,并解决可解释性问题。

百度云这次推出的千帆慧金主要围绕这两方面所打造,包括一个金融知识增强大模型,基于数百亿tokens的高质量金融领域和通用混合语料,可显著提升金融知识问答、财报分析等行业高频场景的模型效果;另一个是金融推理增强大模型,专门面向金融行业特有的复杂推理和计算场景。

这两个模型目前都支持最长32K的上下文输入,以覆盖金融行业绝大多数场景,并提供两个版本参数的模型。其中,8B版本小参数模型,响应快、易部署,适用于意图识别、指标抽取等对时效要求高、任务相对明确的场景;70B大参数版本则更适合处理复杂推理、多轮任务规划的问题,比如投研辅助、策略分析。

金融机构可以根据场景需求直接调用,也可以把它们作为基座模型,在实际场景进一步精调专属模型,以更低的成本、更灵活的部署方式,实现更好的效果。

会议现场,沈抖演示了千帆慧金在销售赋能场景的应用效果,对比通用模型,千帆慧金根据销售走访记录,以及自己掌握的金融行业know-how,可以更为准确地识别出下一步需要推动贷款签约,并进行详细的工作流程规划,以及更精确的风险提醒。

“金融大模型只是起点。未来,我们会根据客户需求,推出更多的垂直行业场景模型。”沈抖表示,目前,千帆上已提供超过100个模型服务,企业可以根据业务需要,自由选择最合适的模型,快速启动、灵活组合。

03

企业GPU云,从“堆卡为王”走向高利用率

在怎么开发、选什么模型之外,用什么算力也关乎智能体是否能顺利落地。实际上,大模型及智能体落地,也引发了企业算力基础设施的深层次变化。

在大中企业中,通常都有自己的算力基础设施。从2023年起,这些企业开始陆续建设以GPU为主的算力能力。“企业有不同的规划和方法。”百度智能云混合云总经理杜海观察,这主要由人工智能在企业业务中的发展状态和定位决定。目前企业的建设大致分为四类:

第一类是基于传统CPU平台,进行轻量化升级。这类企业原本的CPU云平台较为完整,已具备小模型支持能力,当前希望增强GPU算力,用于开展大模型的初步探索。几年前,能源行业用户多属于此类。因此,客户可基于现有CPU平台进行升级,部署一套轻量化异构计算平台。如某能源央国企,通过百度百舸模块化组件,解决异构资源管理、调度与分配。

第二类企业已明确提出大模型场景需求,尤其是发布了行业大模型的企业,开始进入全栈规划阶段。这类企业涵盖制造、化工、能源等领域,在传统CPU云平台之外,正着手打造包括芯片算力、基础设施、MaaS平台与应用层的完整AI能力堆栈。以中钢研为例,它发布了冶金流程感知大模型,聚焦全栈AI架构,看重全栈交付和运维一站式技术兜底能力。

第三类属于“AI原生企业”,即AI能力本身就是其核心竞争力。典型如车企,正在大规模建设一个或多个GPU集群,水准仅次于互联网巨头。其需求不仅是“建起来”,非常看重资源调度、利用率、训练集群稳定性、模型加速等AI工程化能力。长安汽车即是代表,其超大规模算力中心服务于智能座舱与自动驾驶研发,极度重视跨云统管和调度,以及GPU算力效率提升实战能力。

第四类企业则在企业自建算力平台之外,通过GPU算力订阅服务来满足短期或峰值需求,降低算力成本。潍柴动力便是此类企业的代表。在推进企业大模型建设过程中,依托百度混合云ABC Stack,结合百舸,实现多场景支撑与资源弹性调度,支撑和扩展其研发、运营、办公等六大AI场景。

今年企业级客户在算力效率与稳定性的关注显著上升。“年初DeepSeek给业界带来的发展思路,让大家对于整个集群的使用效率,在最近几个月达到一个新的顶峰。”杜海告诉数智前线,“前两年大家在堆卡,这半年我们接触最多的需求,也是最能打动客户的,是百舸如何实现将集群效率、稳定性达到更优的状态。

然而,在具体实践中,GPU云在硬件结构、任务模式、资源观测方式等方面与传统CPU云存在明显差异,业界在合理使用上,仍处于“磨合期”。为应对这一趋势,百度智能云和企业一起结合业务,在资源调度、任务编排、性能优化等多环节提开展大量细致的工作,提升整体GPU平均利用率和稳定性。

除了上述特点外,杜海告诉数智前线,大中型企业客户在算力基础设施上呈现的另一个重大变革是从私有化部署,走向“混合云”模式。一些客户要求云厂商将资源部署到自己指定的机房,来满足其对数据隔离性、网络安全的严格要求;另一些客户则倾向于公有云上的隔离域,来保障数据安全。

汽车和金融是这一算力策略变化最大的两个领域。造车新势力已普遍接纳公有云,而传统车企在电动车业务上,对混合云也展现高接受度。金融行业的变化也非常大。之前由于合规要求,它们都是纯私有化部署。而这两年互联网银行与新型金融科技企业,尝试将部分计算任务迁移至混合云,以应对不断增长的GPU需求。这种转变也受到相关新政策支持。此外,能源行业客户也在向混合云靠拢。

与此同时,国产GPU的接受度快速提升。DeepSeek出来之后,随着行业标准趋同、实际表现不断验证,国产卡在更多场景中被广泛采纳,使用门槛也低于客户此前预期。

今年,百度成功点亮了昆仑芯三代万卡及三万卡集群。目前,国家电网、中国钢研、招商银行,以及北大、同济等高校和互联网企业,已经开始规模部署P800。在金融领域,百度智能云与招商银行也正基于昆仑芯P800开展算力合作,稳定支撑该行DeepSeek等各类大模型的训练与推理任务,部分多模态模型推理性能达到行业领先水平。

“有人说,想象未来最好的方式就是去创造它。”沈抖说,模型能力和工程能力的持续进化、算力成本的不断降低,会为企业打开想象空间,让很多原本难以实现的场景,从“不可能”变成“可能”。

伴随央国企积极布局产业大模型、加速智改数转,百度智能云已将全栈AI能力体系深度嵌入企业各类业务场景,联合众多央国企伙伴打造了一大批可推广、可复制的标杆案例。数智前线获悉,目前,已有65%的央企选择与百度智能云开展深度合作,共同探索AI创新,而受AI驱动,百度智能云业务在2025年第一季度增长强劲,同比增速达42%。

来源:数智前线

相关推荐