财通计算机 · 全球Agent产业化竞速

B站影视 韩国电影 2025-10-13 13:12 1

摘要:全球大模型Agent能力产业化加速落地。2025年9月以来,全球大模型领域发展主线从“参数规模竞赛与榜单跑分”转向“Agent能力嵌入系统与核心入口”,海外厂商如OpenAI、Anthropic、Google各有技术与商业化推进,国内厂商围绕“模型—入口—算力

核心观点

全球大模型Agent能力产业化加速落地。2025年9月以来,全球大模型领域发展主线从“参数规模竞赛与榜单跑分”转向“Agent能力嵌入系统与核心入口”,海外厂商如OpenAI、Anthropic、Google各有技术与商业化推进,国内厂商围绕“模型—入口—算力”协同布局且产业三角架构初成。本轮变革核心是大模型从“单一语言交互的能说会答”升级为“多模态感知的能看会做、全链路可控可管”,并从单点技术突破转向系统化能力构建,产业化落地持续加速。

内容、Agent、入口三线推进:海外头部厂商的AI系统升级路径。OpenAI、Anthropic、Google等海外厂商的共同方向,是用产品形态与系统接口承载Agent,让模型从“能说会答”升级到“能看会做、可控可管”,并把入口(浏览器/家庭)与工具链(SDK/测试/安全)做厚,推动从技术演示向产业化落地的迁移。

模型—入口—算力三线合围的中国路径。阿里巴巴、腾讯、字节、百度、快手、华为等国内厂商的共同方向,是以“旗舰基模”确立能力上限,以“Agent/ADP/ADK”打通开发与运维,以“算力与计量服务”稳定供给,再辅以“视频/图像生成的性价比迭代”打开应用规模。整体链路从“模型→平台→入口/场景→供给侧”逐步闭合,向“能看会做、可控可管”的系统能力收敛。

海内外AI升级共振:从“会说”到“会做”,由点到链的系统化升级。当前AI产业已步入规模化落地关键阶段,下一阶段竞争核心聚焦“工程化的三角”体系构建——涵盖Agent工程化、入口承载力、供给侧计量三大维度,叠加资本与资源耦合的差异化路径,最终将收敛至“通用智能即基础设施”的产业终局。海内外发展核心差异体现在节奏与财务结构选择:海外企业凭资本、技术优势加速通用智能前沿探索,但需承担高研发投入与财务风险;国内企业依托场景复用及成本控制,以稳健节奏推进并侧重“规模化盈利”,却需警惕技术迭代滞后风险。未来,在“节奏把控”与“财务健康”间实现平衡者,将在“通用智能基础设施”终局竞争中占据主导地位。

投资建议:见正文。

风险提示:技术迭代不及预期的风险;商业化落地不及预期的风险;政策支 持不及预期风险;全球宏观经济风险。

正文内容

01

全球大模型Agent能力产业化加速落地

2025年9月以来,全球大模型领域发展主线已从“参数规模竞赛与榜单跑分”转向“Agent能力嵌入系统与核心入口”,行业重心加速从技术演示向产业化落地迁移。海外市场方面,OpenAI以Sora 2模型及独立Sora App为核心,推动视频生成技术进入商业化可运营期,不仅整合了长镜头物理一致性、音画同步优化与内容分发功能,还配套了明确的合规管理方案;Anthropic发布Claude Sonnet 4.5模型,强化“模拟电脑操作、长时任务执行”的工程化能力,同步完善Agent开发与运维链路,聚焦“从榜单分数领先转向生产环境可用”;Google将Gemini深度融入Chrome浏览器,以高频场景承载内容理解、跨标签协作,并推出专用模型实现浏览器内表单提交、流程测试等操作,拓展“从回答到执行”的能力边界。国内大模型厂商围绕“模型—入口—算力”展开协同布局:阿里在云栖大会发布Qwen3-Max旗舰基模;腾讯既面向全球开放企业级智能体平台ADP 3.0,其混元Image 3.0也在开源图像生成榜单登顶;快手可灵2.5 Turbo在视频生成质量与成本控制上双向突破,推动技术从“可看”向“可用”过渡;华为依托CloudMatrix384架构与推理计量服务夯实算力基础;百度发布文心大模型X1.1加码推理性能与多Agent协同,国内产业三角架构已初步成形。综上,本轮变革核心是大模型从“单一语言交互的能说会答”,升级为“多模态感知的能看会做、全链路可控可管”,从单点技术突破转向系统化能力构建,产业化落地不断加速。

02

内容、Agent、入口三线推进:海外头部厂商的AI系统升级路径

OpenAI:视频生成进入“产品—合规—分发”三位一体的运营期。9月末,OpenAI以Sora 2为底座,推出独立Sora App,将长镜头物理一致性、角色跨镜头延续与音画同步等核心能力收拢到一个面向大众的产品形态中:用户不仅能“生成”,还能在应用内浏览、复用与二次创作,并通过“客串式”素材插入(cameos)打通社交传播链路。伴随下载量在发布后数天即跃升至百万量级,平台侧的治理与合规被前置为同等重要的工程任务——OpenAI在发布页明确“负责任上线”框架,强调内容标记与权利方控制;主流媒体对未成年人与名人肖像等敏感场景的讨论,也倒逼平台建立更细粒度的创作边界与审核机制。整体看,Sora不再是“演示级模型”,而是“可持续运营的内容平台能力”,一端是视频生成的质量与可控性,另一端是分发与合规的系统化建设。

Anthropic:从“会答题”到“会做事”,以工程化链路把Agent落到生产。9月29日,Anthropic发布Claude Sonnet 4.5,官方定位为其“最佳编码与电脑使用”模型:在大体量代码生成与重构、长时多步任务、工具/终端操作等方面做了系统增强,并同步推出Claude Agent SDK、Claude Code/终端接口与检查点回滚等能力,明确把“能写、能调、能跑”的闭环纳入可运维的研发流程。与此同时,模型在长时任务上的稳定性(“连续数十小时保持同一项目上下文”)以及面向企业使用的价格与接入路径(API/控制台/Bedrock),共同指向从“分数领先”向“生产可用”的迁移。就方法论而言,这一代迭代不再将“模型效果”与“系统治理”割裂,而是通过可回溯、可观察与安全分级,降低Agent在实际业务中的引入成本与运维风险。

Google(Gemini):把智能嵌入浏览器入口,并以“Computer Use”从回答迈向执行。9月,Google将Gemini深度融入Chrome:在地址栏与浏览器侧边栏内提供对页理解、跨标签比较与摘要能力,配合“AI Mode”在搜索端的视觉—文本联动,形成“高频入口上的轻量Agent”。10月,Google DeepMind又发布Gemini 2.5 Computer Use专用模型,面向“在受控环境内操控UI”的Agent场景:模型通过对界面截图的视觉理解与推理,循环地产生“点击、输入、滚动、下拉选择”等13类原子动作,可完成表单提交、流程测试与登录后操作等任务;同时在工程侧提供“逐步动作安全审查”、“高风险操作须确认”等防护与开发者开关。官方博客强调其在Online-Mind2Web等基准上的领先与低时延,以及在Google AI Studio/Vertex AI的预览开放与Browserbase演示环境,标志着浏览器从信息入口升级为“可执行的工作流容器”。

整体来看,海外厂商的共同方向,是用产品形态与系统接口承载Agent,让模型从“能说会答”升级到“能看会做、可控可管”,并把入口(浏览器/家庭)与工具链(SDK/测试/安全)做厚,推动从技术演示向产业化落地的迁移。

03

模型—入口—算力三线合围的中国路径

阿里巴巴:以万亿级参数旗舰基模牵引“模型—平台—入口”一体化升级。云栖大会期间,阿里发布Qwen3-Max作为通义千问家族的旗舰基模,官方口径明确“万亿级参数、Instruct/Thinking双形态”,并在代码、推理与Agent能力上给出系统性强化;同时配套Qwen3-VL(具备“操作电脑/手机界面”的视觉代理能力)、Qwen3-Omni(原生端到端多模态)与Wan2.5预览(文/图/视频生成与编辑)等全系产品,形成从基础模型到企业ADK/ADP工具链、再到创作入口(夸克“造点”等)的完整路径。整体上,阿里的发力点已从“单模态的模型迭代”,转向“以旗舰基模为核心、以Agent开发与分发入口为两翼”的体系化推进。

腾讯:企业级Agent工程化与开源图像模型双线走强。9月16日,2025腾讯全球数字生态大会上,腾讯首发“腾讯云智能体战略全景图”,推出智能体开发平台3.0(Agent Development Platform 3.0,新增近600项功能,无编程经验者亦可开发)、混元3D 3.0(建模精度提升3倍)等新品,并明确“智能化提效、全球化扩规模”双引擎战略;AI应用层面,“元宝”日提问量较年初增长30倍,跻身国内AI原生应用DAU前三,广告、游戏等业务借AI实现收入增长,软件开发中AI生成超50%的新增代码。腾讯混元进展同样突出,实验室一年内发布超30个模型,混元翻译获国际大赛30项第一;9月28日开源的混元图像3.0,在LMArena盲测中登顶全球26个大模型榜单,且具备多模态创作能力,混元3D、世界模型也在国际评测中夺冠,3D系列模型下载量超260万。此外,腾讯云在全球11个区域设立办公室,升级星星海服务器等产品,EdgeOne Pages出海用户3个月内超10万,同时全面适配国产芯片,以全栈自研能力为AI落地提供完整体系。

百度:推理向底座与多Agent协同并进。2025年9月9日,百度在WAVE SUMMIT深度学习开发者大会上,正式发布文心大模型X1.1,该模型基于文心大模型4.5训练,采用迭代式混合强化学习训练框架,相比文心大模型X1,事实性提升34.8%、指令遵循提升12.5%、智能体提升9.6%,能高效处理复杂写作与长程任务,在权威基准评测中超越DeepSeekR1-0528,与GPT-5、Gemini2.5Pro效果持平,目前可在文心一言官网、文小言APP及百度智能云千帆平台使用;大会还发布剧本驱动多模协同的数字人技术(含五项创新技术,数字人直播表现超真人,如罗永浩数字人首播GMV破纪录)、飞桨框架v3.2(通过三大核心升级提升训练效率,强化芯片适配能力,配套大模型高效部署套件等,还开源ERNIE-4.5-21B-A3B-Thinking模型)、文心快码3.5S(强化多智能体自协同能力,实现“一人即团队”开发模式,服务超1000万开发者),同时披露飞桨文心生态已有2333万开发者、76万家服务企业,发起“AI助老公益计划”、推出“文心导师・星耀计划”,并与中国科技馆联合发布“首个科技馆智能体矩阵”及启动“未来之翼科普共创计划”。

快手:可灵2.5 Turbo全方位升级并降价30%。2025年9月26日,可灵AI平台向创作者宣布新版模型与功能上线,重点推出可灵2.5 Turbo模型,该模型在稳定性与想象力上全方位升级,视频效果实现超世代提升,同时定价下调30%,高品质5s视频生成灵感值从35降至25,较可灵2.1同档位便宜30%,其中黑金会员每月可生成1000+条该模型高品质视频,钻石会员每月可生成320条;通过KlingBench 1.0评测集(覆盖多测试维度,评测时间2025年8月14日-9月19日)对比,其图生视频与文生视频效果均超过Veo3 Quality、Veo3 Fast、Seedance1.0及Seedance 1.0 mini等模型,且在提示词理解与时序控制(能解析复杂指令,将静态图转化为叙事连贯的动态视频)、高速动态质量(引入强化学习,生成高动态动作且画面流畅稳定)、多种风格保持(精准捕捉原作艺术风格,确保帧画面视觉特征统一)上显著提升,文生视频具备美学升级、动态稳定等优势,图生视频有特效玩法丰富、跨场景切换丝滑等特点,为影视、短剧等专业创意场景奠定基础,未来可灵AI还将持续提升模型质量并开发新功能,助力创作者“用AI讲出好故事”。

华为:以CloudMatrix384与AI Token服务夯实推理供给侧。2025年9月在上海举办的第十届华为全联接大会(HUAWEI CONNECT 2025)上,华为云重点发布多领域技术与服务:推出由CloudMatrix384超节点(未来将向8192卡更大规模演进)承载的AITokenService“算力即结果”推理计量服务,通过“资源汇池+任务解耦+并行化”提升推理吞吐,该超节点昇腾AI云服务推理性能领先,目前全球AI云服务客户已增至1805家;同时发布CloudRobo具身智能平台、R2C协议、Versatile Agent平台等,并推动盘古大模型以开源与闭源模式落地30多个行业的500多个场景。此外,华为云依托“全球一张网,数智双引擎”体系,为多家企业解决业务难题、提供数智化转型支持,且始终沿“软硬一体”路径,以可获取的高密度算力与可计量的推理服务,为国内模型训练/部署及行业落地提供稳定底座。

字节跳动:Seedream4.0将“生成+编辑”整合为统一架构,在多模态效果、速度和可用性上均实现显著突破。2025年9月9日,字节跳动 Seed 团队发布图像创作模型 Seedream 4.0,以同一构架实现文生图与通用编辑能力,融合常识推理,较前代在多模态效果、速度(推理提速超 10 倍)、可用性上显著突破,支持多创作模式、4K 生成及多样艺术风格迁移。其有精准编辑、视觉信号可控生成等八种基础玩法,覆盖多场景需求;在 MagicBench 评测中,文生图与图像编辑居业界头部,单图编辑综合 Elo 排第一。模型通过整合能力、高效架构、联合训练及推理优化(如对抗蒸馏)实现高质量与高效生成统一,未来将进一步探索实时交互与多模态融合。

整体来看,国内厂商的共同方向,是以“旗舰基模”确立能力上限,以“Agent/ADP/ADK”打通开发与运维,以“算力与计量服务”稳定供给,再辅以“视频/图像生成的性价比迭代”打开应用规模。整体链路从“模型→平台→入口/场景→供给侧”逐步闭合,向“能看会做、可控可管”的系统能力收敛。

04

海内外AI升级共振:从“会说”到“会做”,由点到链的系统化升级

近期以来海内外AI升级,全球路径同步收敛到三件事:第一,把模型升级为能理解多模态、能操控界面与工具的Agent;第二,用标准化工具链与可观测/可回溯机制降低企业引入与运维成本;第三,把高频入口(浏览器、应用端侧)与供给侧能力(算力计量、推理吞吐)做厚,形成“模型→平台→入口/场景→供给侧”的闭环,从“参数与榜单”转向“产品与运营”。OpenAI 在产品化与合规治理并举的同时,开始通过“资本+供给”的复杂交易结构锁定未来算力与系统能力:除与 Oracle/SoftBank 的“Stargate”超大算力与云合作外,又分别与 Nvidia、AMD达成直供与协同开发并含股权安排的长期协议,且管理层明确“未来数月还有更多大单”将落地;其中,Nvidia 首次对 OpenAI 进行直销,并公开将其视为为“自托管超大规模数据中心”做准备的前置动作,侧面印证 OpenAI 正在把“模型能力预期”直接转化为“基础设施超前押注”的产业组织策略。上述交易还被外界称为“循环式”或“以股换供给”的结构创新,目的在于以更低的现金压强换取更高的可用算力与更快的迭代节奏。

当前AI产业已从技术单点突破迈入规模化落地关键期,下一阶段的竞争胜负手将高度聚焦于“工程化的三角”体系构建,其涵盖Agent工程化、入口承载力、供给侧计量三大核心维度,同时叠加资本与资源耦合的差异化路径,最终将收敛于“通用智能即基础设施”的产业终局,具体研判如下:

一、Agent工程化:企业规模化落地的核心壁垒

Agent作为AI与产业场景深度融合的关键载体,其工程化成熟度直接决定企业侧应用的规模化能力。当前行业痛点集中于工具调用的稳定性不足、长程任务规划的逻辑断裂、动作序列的可追溯性缺失,导致多数Agent仍停留在Demo阶段,难以适配企业复杂业务流程。下一阶段,谁能率先将工具使用的接口标准化、长程规划的算法模块化、可审计动作序列的日志体系规范化,形成具备兼容性、安全性、可扩展性的SDK(软件开发工具包)与治理基线,谁就能突破企业规模化应用的核心瓶颈。例如,在金融风控场景中,标准化的Agent SDK可快速对接企业内部的信贷审批系统、征信数据库等多类工具,通过预设的治理基线确保风险评估流程的合规性与可追溯性;在智能制造场景中,稳定的动作序列治理能保障Agent与生产设备的协同精度,避免因流程断层导致的生产事故。此类工程化能力将成为企业选择AI解决方案的核心考量,进而在B端市场形成规模化优势。

二、入口承载力:C端与办公场景渗透的关键抓手

随着AI从“辅助工具”向“生产力入口”转型,入口承载力的强弱直接决定用户日活(DAU)与功能复用率的高低。当前多数AI工具仍局限于“生成即终点”的单一模式,未能与用户真实工作流中的“操作→校验→回滚”环节打通,导致用户使用门槛高、场景适配性差。下一阶段,竞争焦点将集中于浏览器端、客户端等核心入口的全流程闭环构建:一方面,需实现“生成内容直接关联操作指令”,例如在文档编辑场景中,AI生成的方案可直接触发格式调整、数据插入等操作;另一方面,需完善“校验→回滚”机制,支持用户对AI操作结果进行实时核查,若不符合需求可一键回溯至历史版本,确保操作安全性与灵活性。这种与真实工作流深度贴合的入口设计,能大幅降低用户使用成本,提升功能复用率——例如在电商运营场景中,AI生成的营销文案可直接同步至商品详情页编辑器,运营人员可实时预览效果并修改,无需跨平台复制粘贴,进而推动DAU与用户粘性的持续增长。

三、供给侧计量:大客合作与生态构建的信任基石

AI供给侧的计量能力是决定企业能否获取大型客户、构建稳定生态的关键变量。当前行业普遍存在推理成本不透明、并发调度效率低、成本弹性不足等问题,导致大型客户在合作中面临“预算不可控”、“服务稳定性难保障”等顾虑,难以形成长期合作。下一阶段,谁能将推理计量(如Token消耗、算力占用)、并发调度(如资源分配优先级、峰值负载应对)与成本弹性(如按需付费、长期合约折扣)转化为可量化、可对账的产品能力,谁就能在大客合作中建立“可结算的确定性”。例如,针对金融、政务等对成本敏感度高的行业,提供按业务场景定制的计量套餐,明确每笔AI服务的算力消耗与费用构成;针对互联网企业的峰值需求,提供弹性调度方案,在流量高峰时自动扩容,低谷时缩减资源,实现成本最优。这种透明化、可控化的供给侧计量能力,能增强客户合作信心,推动从“项目制合作”向“长期生态绑定”升级。

四、资本与资源耦合:中外差异化路径的核心逻辑

海外路径:交易结构创新+自托管预备,锁定长期资源。海外企业更倾向通过“交易结构创新”将技术能力预期直接转化为资源锁定——例如OpenAI与甲骨文的3000亿美元算力交易、英伟达以GPU入股xAI的合作模式,既通过长期合约保障自身算力供给,又借助“自托管预备”机制(如预留部分算力资源用于客户私有部署)提升客户信任度。这种模式的核心在于“以能力换资源”,通过技术优势撬动资本与硬件资源的长期绑定,进而在通用智能赛道抢占先机。

中国路径:体系力+性价比,靠多行业复制堆确定性。中国企业则聚焦“体系力+性价比”的资源效率优化,通过全产业链协同降低成本,依托多行业场景复制形成规模效应。例如,华为云通过昇腾芯片、盘古大模型、CloudMatrix算力平台的全栈协同,降低企业AI部署成本;腾讯云通过“智能体开发平台3.0”支持多行业快速适配,在零售、医疗、政务等领域实现规模化落地。这种模式的核心在于“以效率换规模”,通过资源整合与场景复用,在差异化赛道构建确定性优势。

五、最终收敛:通用智能即基础设施,节奏与财务结构决定竞争格局

尽管中外路径存在差异,但长期来看,AI产业的终局将收敛于“通用智能即基础设施”——无论是海外的“技术驱动型”路径,还是中国的“效率驱动型”路径,最终都将实现通用智能能力的标准化、普惠化,成为像水电、云服务一样的基础资源。两者的核心差别在于发展节奏与财务结构的选择权:海外企业凭借资本与技术优势,可能在通用智能的前沿探索上节奏更快,但需承担更高的研发投入与财务风险;中国企业依托场景复用与成本控制,发展节奏相对稳健,财务结构更偏向“规模化盈利”,但需警惕技术迭代速度滞后的风险。未来,谁能在“节奏把控”与“财务健康”之间找到平衡,谁就能在“通用智能基础设施”的终局竞争中占据主导地位。

05

投资建议

建议关注AI应用产业链:金蝶国际、第四范式、快手-W、迈富时、美图公司、阿里巴巴-W、腾讯控股、百度集团、金山办公、福昕软件、虹软科技、科大讯飞、万兴科技、美图公司、新致软件、合合信息、百望股份等。

建议关注算力产业链,具体细分赛道如:

GPU:海光信息、寒武纪、阿里巴巴、百度、摩尔线程、沐曦股份、龙芯中科等;服务器:中科曙光、浪潮信息、紫光股份等;

液冷:英维克、东阳光、曙光数创等;

电源:欧陆通、麦格米特、中国长城等;

柴油发动机:潍柴重机、泰豪科技、科泰电源等;

EDA:华大九天、概伦电子、广立微等;

IDC&算力租赁:协创数据、奥飞数据、科华数据、宏景科技、卡莱特、大位科技、润泽科技、数据港、光环新网、世纪互联、万国数据、亿田智能、有方科技、润建股份、首都在线;华为链&国产链:神州数码、纳思达、软通动力、智微智能、广电运通、禾盛新材、拓维信息、中国软件国际等。

技术迭代不及预期:若AI技术迭代不及预期,大模型优化受限,则相关产业发展进度会受到影响。

商业化落地不及预期:大模型结合应用的盈利模式尚处于探索阶段,后续商业化落地进展有待观察。

政策支持不及预期:新行业新技术的推广需要政策支持,存在政策支持不及预期风险。

全球宏观经济风险:垂直领域公司与下游经济情况相关,存在全球宏观经济风险。

注:文中报告节选自财通证券研究所已公开发布研究报告,具体报告内容及相关风险提示等详见完整版报告。

证券研究报告:《全球Agent产业化竞速》

对外发布时间:2025年10月12日

报告发布机构:财通证券股份有限公司(已获中国证监会许可的证券投资咨询业务资格)

分析师 杨 烨

联系人 陈梦笔

来源:新浪财经

相关推荐