摘要:LLM与Agents的关系: 1)从功能上看,LLM更适用于完成相对孤立、直接的任务,对于复杂场景、复杂任务力不从 心。而AI Agents更适合完成连续的、复杂的场景和任务,是LLM的进阶。2)从结构上看, LLM是Agents的大脑,是信息中心和决策中枢,
Chat强调的是“说”,Agent强调的是“做”
LLM与Agents的关系: 1)从功能上看,LLM更适用于完成相对孤立、直接的任务,对于复杂场景、复杂任务力不从 心。而AI Agents更适合完成连续的、复杂的场景和任务,是LLM的进阶。2)从结构上看, LLM是Agents的大脑,是信息中心和决策中枢,是Agents必不可少的组成部分。 Agents让AI与人类协同从“副驾”到“主驾”:人类与AI协同的三种模式分别为:1)以ChatGPT为代表的Embedding模式,通过提示词让 AI协助完成目标,人类仍是任务主体;2)以Microsoft 365 Copilot等为代表的Copilot模式, AI参与到工作流的各阶段,人类与AI各司其职;3)未来有望过渡到Agent模式,由人类设定 目标并提供资源,AI完成绝大部分工作。
目前Agent能力领先者为GPT的Operator
OpenAI发布CUA( Computer-Using Agent )模型——Operator 。 OpenAI在2025年1月24日发布Operator:核心能力为1)GPT-4o的视觉能力,2)高级推 理能力。从而能够解释截图并与图形用户界面(GUI)进行交互。 目前的预览版尚未全面开放,仅供每月付费 200 美元的美国 Pro 用户体验。 通过集成感知(Perception)、推理(Reasoning)和行动(Action)迭代循环。感知:计算机的屏幕截图被添加到模型的上下文中,提供了计算机当前状态的视觉快照。消 除了对专用API的需求。 推理:CUA使用思维链(chain-of-thought)来推理下一步,并通过评估观察结果、跟踪中 间步骤并动态适应,从而提高了任务执行的性能。 行动:执行动作——点击、滚动或输入——直到Operator认为任务完成或需要用户输入。对 于敏感操作,如输入登录详细信息或响应验证码表单,Operator会寻求用户确认。
国内Agent范例:智谱AutoGLM
面向手机的phone use——AutoGLM,面向电脑的computer use——GLM PC, 以及面向网页的GLM-Web能力 。 2024 年 10 月智谱 AI 上线 AutoGLM 功能,通过简单文字或语音指令,模拟人类操作手机。 11月发布系列更新,新增跨应用执行,支持 50 步超长自动驾驶。 使用了UI交互+截屏OCR的控制思路,同样不依赖API 。GLM通过 OCR 技术理解 UI 组件,以及通过链式思维训练理解组件功能,从而识别手机屏幕 上的不同组件并按指令执行任务。主要针对微信、淘宝、美团、小红书等 App 中的用户常用 操作,可独立执行微信互动、外卖下单、抢红包等个性化任务; 不过,AutoGLM 目前仍然需要明确的指令,在跨平台适配性和操作精准性上存在一定限制。 例如,在官方演示视频中,其在下单瑞幸咖啡时支付金额偏高,尚未掌握复杂的 “抢优惠券” 玩法。
总结:推理能力迭代带来的Agent上限快速提升
Agent与LLM关系:Agent强调“做”,LLM强调“说”,二者有区别;但同时LLM 是Agent推理智能的重要来源,类似“大脑”; 2025年后Agent能力上限提升明显:以OS world为例,人类专家水平72.4%,目前 海外Agent模型最高水平从24年5月的12%提升至25年1月的38.1%(Open AI Operator );国内Agent模型最高水平为24.6%(UI-TARS)。 目前大部分Agent按照感知(P) — 规划(P) — 行动(A)循环,执行任务。 感知层:大部分模型选择视觉(多模态或OCR),而且API; 规划层:复杂任务规划能力上限随着LLM推理能力迭代而提升; 行动层:一般在PC或者端侧手机执行,使用类按键精灵的方式。 我们预测:2025年可能是Agent爆发的一年。
产品力提升:自主创建工作流+多Agent联合处理
Agent自主创建工作流:简历分析-候选人匹配-候选人联系-面试安排 。定制化功能一:AI自主生成候选人匹配功能,结合公司需求筛选候选人。 定制化功能二:AI结合公司数据,准备和岗位需求高度相关的面试问题。
Multi-agent用例:通过Agent进行信息分析和总结 。 多Agent联合处理:Agentforce预判用户对供应链问题的关注,并推荐产品专家Agent联合处理。 Agent参与项目讨论:多个Agent作为群成员与项目成员互动,解答问题和完成任务。
产品力提升:升级Atlas推理引擎,“定制化”回应
升级的Atlas推理引擎:能够给出更定制化的回应。评估用户的输入-基于上下文细化用升级的RAG提取数据云最相关的信息-生成回应-评估回应质量-决定下一步最佳行动。 用例:利率下行对用户的投资有什么影响。 Agentforce2.0:基于用户的投资组合,给出各个基金受影响的程度,并给出依据和 思考逻辑,相比于1.0的笼统回答,在定制化程度和逻辑深度上都有提升。
上一轮计算机定制化问题解决:中台化
阿里中台概念2018年提出:大中台、小前台。 大中台:提炼各个业务条线的共性需求,并打造组件化的资源包,然后以接口的形式提供给 前台各业务部门使用,最大限度地减少“重复造轮子”的KPI项目。 小前台:前台要做什么业务,需要什么资源可以直接同公共服务部要。在底层不变动的情况 下,让“小前台”更加灵活敏捷。
软件行业本质在于边际开发成本递减,人均收入是商业模式成功关键。国外中台战略起步早,典型软件公司如Salesforce、微软、Adobe、SAP人均收入显著高于 国内公司。 Salesforce是典型代表,自开展践行平台化战略以来,人均收入持续提升,2016年拐点非常 明显。
上一轮云计算商业模式创新:从License到服务费
赢家通吃:SaaS公司表观为现金流改善,实质是商业模式变好。 具体的扣非利润、FCF,美国科技与中国消费,有类似特征。如果国内SaaS公司云化成功, 财务特性会相似。 商业模式变好原因之一:扩大的用户基础。商业模式变好原因之二:订阅费使用成本降低、迁移成本提高带来的高用户粘性。
微软:成立CoreAI,打造Copilot&AI stack
微软CEO:AI agent将重塑SaaS。 SaaS 应用程序将从简单的 CRUD 数据库演变为由AI agent编排的业务逻辑层,AI agent跨多个 SaaS 应用程序协调工作,无需直接访问单个应用程序的数据。(纳德拉25年1月访谈) An Agentic world有赖于AI三种呈现指数级增长的能力:多模态通用界面、推理和规划能 力、记忆和丰富的上下文能力(微软2024) 。 组织架构变革:25年1成立CoreAI-平台和工具,目标打造Copilot 和 AI 堆栈,以支持各 类 AI 应用程序和AI Agents构建与运行。 整合微软的开发者部门、AI平台、CTO办公室的关键团队,由Meta 前工程主管Jay Parikh 领导。突破组织边界,促进跨部门协作; 构建平台-工具-基础设施的反馈链路,推动 AI 技术和产品迭代
微软Copilot&AI堆栈方便用户构建自己的Copilot和智能代理:推出Azure AI Foundry一站 式创建AI应用,在Microsoft 365、Dynamics等集成AI Agent服务。 在订阅模式之外推出即用即付模式: 办公SaaS及AI升级后的Copilot产品主要采用经典的月付费模式,Microsoft Copilot Studio在包月 模式外提供了即用即付模式-每条消息0.01美元。
Salesforce:Agentforce引领B端应用落地
Salesforce在2024年9月发布Agentforce,真正的Agent而非加强的GPT。 配置了销售、营销、分析、人力等全方位Agent,通过数据云链接各业务数据,用户能够通过一个AI链接各个应用。 Agentforce期望是具有高度自主性、目标驱动、具备反思能力的Agent。 非标准化需求蓝海市场,Agentforce交易量速增。 过往企业相当一部分独特、个性化需求未被标品满足,Agent善于处理非结构化数据,且能够根据企业流程灵活定制化, 适用于满足非标需求。 Agentforce10月底开始销售,截止FY24Q3业绩说明会,已达成约200笔交易。
ServiceNow:Now Assist AI平台为核心
以Now Assist AI平台为核心,结合预构建行业专有Agent和自定义开发工具,覆盖ITSM、 CSM和HR等场景。 公司主要围绕生产流程自动化提供AI工具包,包括数百个针对各工作环节的AI功能,其中企业级检索为 十分重要的方向,通过RAG强化检索能力,能够进一步加强对于非结构化的数据的分析。24年9月发布了Xanadu,包括数据可视化自动化等300+AI功能。 25年1月发布AI Agent Orchestrator和AI Agent Studio,Orchestrator管理多个AI Agent完成跨系统 跨部门协作;Studio为无代码开发工具,支持企业定制AI Agent。
SAP:智能副驾已实现跨应用、自动创建流程
24Q4通过智能副驾Joule将企业接入AI智能体,核心完成 。 跨应用集成、全平台信息检索、自动创建流程并执行、智能推荐及代码生成; 目前已经嵌入人力、财务、销售、服务、营销、商业应用和平台解决方案中,成为Business 。25Q1进入agent应用快速发布阶段。 根据规划将在25Q1发布咨询(快速提供实施问题的答案,减少实施顾问成本)、供应链(提 升场景分析效率,给出订单异常建议)、自动分析洞察等产品。
金山办公:基于agent实现伴写功能
金山办公发布全新基于AI Agent范式驱动的WPS AI伴写功能,提升AI在文档领域生 成效果。 用户可上传云文档、网页等参考资料,实现精准伴写;传统大模型和人类的交互基于提示词实现,提示词质量直接影响生成效果,但AI Agent范式 具备根据命题独立思考、主动调用工具逐步完成给定目标的能力。很大程度降低了AI相关使 用门槛,提升使用效率和准确性。 此外,提供多种角色撰写符合职业特点的后续文档。
泛微网络:Agent赋能OA/企业管理+AI落地
OA+企业管理:预计将率先商业化 。 作为最贴近员工的数字化入口,天然与LLM+Agent结合更易 。Agent在企业端落地的重要准备:各软件API入口,企业知识库。 企业应用对于相关软件权限要求较高:相比于纯GUI交互,获得ERP/MES/HRM/CRM等各个 软件API接口后,完成Agent操作更容易。泛微网络通过“云桥”等产品完成了API打通。企业知识库是Agent执行的规则来源,但各企业知识库差异极大,这也是办公软件定制化难 点。泛微网络OA天然需要对企业知识库完整梳理。 腾讯企业微信与泛微发布“内外协同的移动办公平台”,就企业级办公展开深入合作。
汉得信息:字节链Agent核心标的
人力提高工程化概率,Agent落地较快的计算机细分领域之一 。主要面向营销、制造、供应链、财务四类领域,累计近百Agent研发完成,场景化落地;基 于自研H-Copilot平台部署、编排Agent;AI为重点战略之一,AI业务也拥有较高景气度 。 字节年度优秀解决方案合作伙伴,共创Agent持续深入。借助火山引擎 HiAgent 平台和豆包大模型,通过OTO(线上到线下)模式,引流拓展中小型 企业,形成客户协同;2022年起和字节有规模性合作,双方在营销领域共创Agent,已有二 手车平台Agent项目落地;智慧导购、智能客服、渠道助手等数款Agent均在规划探索之中。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
来源:未来智库