DeepSeek驱动与Manus突破协同下的Al Agent跃迁趋势探究

B站影视 电影资讯 2025-03-24 09:16 2

摘要:2025年以来,DeepSeek火爆出圈,国产AI大模型能力持续突破,调用/部署成本大幅下降,极大地推动了AI平权进程。作为大模型落地的重要方式,智能体(AI Agent)将加速创新突破,2025年有望成为AI Agent应用的爆发元年。

作者 人工智能产业创新研究中心

2025年以来,DeepSeek火爆出圈,国产AI大模型能力持续突破,调用/部署成本大幅下降,极大地推动了AI平权进程。作为大模型落地的重要方式,智能体(AI Agent)将加速创新突破,2025年有望成为AI Agent应用的爆发元年。

2025年1月,OpenAI发布新款产品“Tasks”,打响了2025年AI Agent的第一枪。3月6日,国内创业公司Monica发布通用型AI Agent产品Manus,性能超越Open AI的同层次大模型。为了充分刻画大模型驱动下AI Agent的技术演进与未来图景,本文将从 AI Agent 的定义与核心特征出发,探讨其与大模型的联系与区别,并提出对 AI Agent 未来发展的趋势展望。

一、何为AI Agent

AI Agent是人工智能流程化的执行者,是人工智能行动力的体现者,是人工智能具象化的承载器。AI Agent能帮助AI从数字世界中“跳出来”扎根于物理世界,成为连接数字世界与物理世界的关键桥梁。OpenAI将AI Agent定义为:以大语言模型为大脑驱动的系统,具备自主理解、感知、规划、记忆和使用工具的能力,能够自动化执行完成复杂任务的系统。简单而言,AI Agent可以视作能够完成特定任务的虚拟人类,它以AI大模型为基础,并通过主动学习或获取知识来持续提升自身能力,除了能够达成既定目标以外,还拥有自主决策和使用工具的能力。

二、AI Agent与大模型的关系

AI Agent和大模型在人工智能领域中扮演着不同的角色,但它们之间存在着紧密的联系。‌大模型是AI Agent的“大脑”‌。大模型是AI Agent实现智能行为的基础。它通过海量数据训练获得通用认知能力,包括文本生成、逻辑推理、图像识别等功能。然而,大模型本身是被动的,只能响应指令,缺乏主动行动的能力。‌AI Agent是大模型的“躯体”‌。AI Agent是大模型的上层应用,它赋予大模型行动能力。通过感知环境、规划任务、调用工具和执行动作,AI Agent将大模型的“想法”转化为实际结果。‌另外,AI Agent还能弥补大模型的局限性‌。大模型在处理复杂任务时可能存在“幻觉”或信息不准确的问题。AI Agent通过自主验证和决策过程,能够修正大模型的输出,确保任务的准确性和效率。

三、AI Agent与大模型有何区别

AI Agent 和大模型并非互为割裂,AI Agent是大模型在发展新阶段的产物及应用能力的延伸。大模型作为“大脑”,赋予AI Agent复杂的推理和决策能力,使其能够理解用户需求并调用外部工具(如天气API、数据库等)。AI Agent将大模型的“知识”转化为动态场景中的行动链,根据任务指令拆解规划,AI Agent作为“身体”去完成相关步骤,突破了大模型的被动性,使其能够在实际应用中发挥更大作用。根据AI自动化程度不同,OpenAI发布的“从AI到AGI(通用人工智能)”,共有如下五步过程:

表1 OpenAI“从AI到AGI”的五个步骤

资料来源:赛迪四川整理,2025.03

OpenAI仅用半年时间,就让大模型成功完成第一、二阶段,目前已跨入第三阶段。与前两个阶段相比,规划、记忆、工具、行动是AI Agent最鲜明的底色。

图1 基于大模型的AI Agent主要构成

资料来源:LLM Powered Autonomous Agents,赛迪四川整理,2025.03

规划任务能力更强。作为对话者阶段的代表产品,ChatGPT侧重于理解和生成自然语言,以实现类人的对话交流。DeepSeek-R1是推理者阶段的代表产品,其认知推理能力已经达到了理科博士和文科助理教授水平。DeepSeek-R1在AIME、GPQA Diamond等多项专业基准测试中展现了顶尖性能,不仅在传统推理任务中表现优异,还在安全合规、长文档分析等多维度展现出全面能力。AI Agent 则以目标驱动,能够高效处理多步骤的复杂任务,拆解任务为小目标进行管理、执行并追踪。“Manus”在任务拆解阶段,将复杂指令动态分解为可执行子任务链。例如“分析特斯拉股票”这一任务会被拆解为数据采集、建模、报告生成等子任务,逐一执行。

学习记忆能力更优。仿照人类记忆机制,AI Agent拥有短期记忆和长期记忆两个部分。短期记忆用于快速响应处理即时任务上下文。AI Agent根据上下文内容即时执行任务以确保复杂操作的连贯性与准确性。在单次任务执行中,短期记忆存储用户当前指令、中间步骤及工具调用状态。例如,Manus在处理“分析销售数据并生成报告”时,能记住数据清洗规则、可视化参数设置等流程细节。长期记忆通过构建用户与任务的知识图谱,驱动系统自我优化,通常利用外部的向量存储和快速检索来实现。AI Agent 能够在使用过程中持续学习、记忆并适应变化的环境甚至迭代自身策略,由此呈现在更多样化场景下的“自治”能力。

自主使用工具更胜。AI Agent工具使用能力是区别于前两阶段(对话者和推理者)的重要特征。在处理复杂任务时,AI Agent能够主动调用外部工具来补足模型知识库,同时协同多个外部工具完成目标任务。AI Agent已经实现利用终端命令或调用外部API等方式,代替用户通过手机或网页执行购买火车票、外卖下单甚至预订酒店等行动。AI Agent利用外部工具与不同系统无缝交互展现出其强大的工具整合实力。目前,Manus已经构建覆盖超300个工具的开放式工具链,以支持跨平台操作与动态调用。同时通过动态规划引擎实现工具调用的智能决策,例如,在旅游行程生成过程中,Manus能自主调用汇率 API、Booking比价、地图导航 SDK等工具,并生成含PDF手册的完整方案。

行动交互能力更足。在AI Agent应用过程中,AI不再停留在“言语”层面,而是真正与物理环境发生联系。AI Agent的行动能力体现在其能够根据规划模块的决策指令,执行具体任务,包括制定闹钟、发红包、购买咖啡等。以“Manus”为例,Manus支持实时动态调整的协作模式,当用户对任务中间结果提出修改,Manus 能立即暂停当前流程,基于新需求重新规划剩余步骤。此外,“Manus”还会根据用户对话主动建议可能需要的任务,用户可选择接受或拒绝,给出新的建议和思考,由此做到“举一反三”。

四、为何是AI Agent

从发展规律来看,AI Agent赋予大模型操作物理世界的能力,是通往通用人工智能的必由之路。AI Agent引入行动能力、长期记忆机制和工具整合能力,构建具有自主思考决策能力的智能体。大模型借力AI Agent不仅能够进行对话交流,还可以真正地“行动”起来,与物理世界产生联系,进一步迈向通用人工智能。Agent已实现拓展大模型能力边界,完成简单任务的决策及执行。不难想象当多个AI Agent进行协同合作时会进一步反映出真实世界的社会行为,拥有更高的自主性,更好地实现通用人工智能目标。

从科技竞争来看,AI Agent是全球科技的重点发力方向。据MarketsandMarkets统计,2024年全球AI Agent市场规模高达51亿美元,Agent已经成为全球AI发展最主要的技术路线之一。微软宣布建立全球最大的企业级AI Agent生态系统,已容纳超过 10 万家组织,进行AI Agent应用创作;谷歌推出商用AI Agent市场AI Agent Space,旨在全面整合AI助手与企业搜索。国内科技巨头包括抖音、百度、华为、智谱、实在智能等,也在快速布局AI Agent领域。智谱AI 发布AutoGLM,已经实现代替人类进行终端操作,目前已覆盖PC、手机、网页端;抖音瞄准平台级Agent产品推出扣子平台,已吸引超过100万用户入驻,发布超过200万个智能体。

从市场需求来看,AI Agent未来市场空间广阔,商业落地蓄势待发。AI Agent拥有庞大的用户基础,具有较高的市场接受度,近年来采用率和渗透率不断提升。2024年下半年,全球的大模型落地应用重点已经转至智能体,国外技术生态已基本成形,国内呈快速追赶态势。微软公布其拥有超过十万智能体产品用户,Salesforce智能体产品已全面进入商业化阶段。国内企业微盟表示,与现阶段成熟的软件产品SaaS相比,其AI Agent产品贡献了高于国内市场约24%的平均续费率,展现出了巨大的商业价值。

五、未来发展趋势展望

边缘化部署与智能硬件深度融合。随着DeepSeek等低成本大模型的成功,模型训推成本降低,模型算法不断创新,伴随模型蒸馏等模型压缩方式的使用,端侧轻量化大模型不断突破,推动大模型与智能硬件广泛融合。未来AI Agent将不仅局限于PC和移动端,还将广泛应用于智能家居、自动驾驶、工业机器人等领域。AI Agent将成为智能终端与物理世界的无缝连接器,为用户提供更直观、更个性化的交互体验。

多Agent协作与群体智能的演进。面对日益复杂的任务,单个Agent难以覆盖所有应用场景。未来,多Agent协作将成为趋势,不同Agent各司其职,通过信息共享和协同作业,推动跨领域创新。这种协作模式将使AI系统在整体效率和适应性上大幅提升。

从硬件依赖到软件赋能的转变。以DeepSeek为代表的低成本高效能模型,正引发一场由硬件密集型转向软件驱动的变革。更低的训练和推理成本将使得各类企业,尤其是软件公司,能够更快地整合AI技术,推出更多基于Agent的创新应用,从而提升整体商业价值。

开放生态与跨界合作。DeepSeek选择开源其算法、模型和训练细节,为全球开发者提供了良好的合作平台。未来,随着更多企业和科研机构参与到AI Agent生态构建中,跨界合作将成为必然趋势,共同推动智能化应用的普及与深化。

六、结束语

面向未来,随着大模型技术的快速迭代升级,以及训练和推理成本的快速下降,人工智能的规模化应用正步入走深向实的关键阶段。AI进入Agent时代绝非仅仅是技术层面的简单跃迁,更是智能水平、创新能力与行业引领力的全方位提升。AI Agent是驱动行业在新一轮科技革命中占据领先地位的关键策略,抢抓AI Agent红利,对企业、科研机构等研发团队、技术支持平台和跨行业应用协同能力提出了更高要求。对于企业乃至社会而言,必须增强创新能力、敏锐把握产业发展脉络,同时提升环境开放力度等软性竞争力,才能切实将AI Agent塑造为推动产业智能化升级的新动力源。


来源:赛迪四川

相关推荐