摘要:最近云计算工程师发现,不管是外部客户还是内部团队,要做 Agent 的技术支持需求变多了,有机构预测,未来两年用Agent的企业数量会翻倍,但企业想做出合用的Agent不容易。
最近云计算工程师发现,不管是外部客户还是内部团队,要做 Agent 的技术支持需求变多了,有机构预测,未来两年用Agent的企业数量会翻倍,但企业想做出合用的Agent不容易。
最早的时候,企业用的Agent大多是客服或问答场景的Chatbot,功能单一,只能机械回复固定问题。
后来出现了工作流形态的Agent,能按固定流程处理审批单这类重复性工作,帮企业内部提效,像Dify、Coze这类低代码平台就快速承接了这部分需求。
但今年,很多企业开始往“自主性 Agent”方向探索,这种Agent没有预设的工作流,能自己规划行动,比如帮用户写文档、做 PPT,甚至打开浏览器整理本地文件夹。
传统应用处理的是毫秒级、不用记上下文的简单任务,运行模式固定;
自主性Agent可能要持续运行几分钟甚至几小时,得记住前后步骤的上下文,还会在后台推理问题、寻求帮助,甚至协作完成任务,工作负载特别不稳定。
它还有 “三难”:输入相同可能输出不同,结果不确定性高;内部包含 Prompt、记忆、模型等多个组件,出了问题难定位;自主运行的特性还带来了不少安全隐患。Agent Infra就是在这样的需求下出现的。
别看Agent Runtime是新方案,它的底层逻辑和国内外同行是相通的,核心都是靠运行引擎、安全沙箱、API 网关、内容管理这些关键模块搭起统一基础,遵循 “从运维出发,先资源后应用开发,再到安全和智能化” 的演进逻辑。
且构建层高度分裂,存在数十乃至上百种框架,业内没有任何共识,需求共性依然更偏向云(如安全工具、运维和存储等)。
大模型爆火时,云厂商们主推的是“AI Infra”,本质就是基于GPU的高性能计算(HPC),核心是让高性能硬件发挥最大效能。
为了算力,全球厂商砸了不少钱,光海外头部四家云厂商的资本支出合计就超3000亿美元,同比增长还超30%,GPU机型也从A100、A800快速迭代到H800及更新版本。
现在,很多新建的智算中心,就算买了足够的 GPU,配套的设施、安全性、运维能力跟不上,还是面临闲置风险。
而且Agent应用需要的不只是HPC,还得兼顾计算、网络、存储,甚至要把Infra的职责往“AI应用层”延伸。
于是,云厂商们纷纷转向Agent Infra,海外的动作尤其快:Google Cloud在3月份推出了Vertex AI Agent Builder。
AWS7月份上线Amazon Bedrock AgentCore,Microsoft Azure也在8月份拿出了Agent Factory,每家都组建了专门的团队,用独立品牌推一体化方案。
在 2025 年腾讯全球数字生态大会上,腾讯集团副总裁、腾讯云总裁邱跃鹏发布了Agent Runtime解决方案,这也是国内云厂商的首个Agent Infra品牌,专门针对 Agent 的大规模应用设计。
比如Agent Runtime的云沙箱,用的是腾讯自研的Cube沙箱技术,能做到100毫秒极速启动,还支持数十万Agent实例同时并发。
除了沙箱,执行引擎会拉起Serverless会话并做隔离,保证用户信息不泄露;
上下文服务负责长期记忆的管理和检索,还能通过优化存储和检索控制成本;
Agent 网关能对接模型服务、接入工具,还能做流量调度和安全防护;安全可观测服务则提供机密计算和日志服务,全链路保障安全。
腾讯云做Agent Runtime还藏着一个“优势”——先用自己内部的业务当“试验田”,比如腾讯内部的各种业务场景,会先试用新技术、新功能,跑通了、效果好了,再对外服务。
不过现在不管是腾讯云的Agent Runtime,还是其他厂商的方案,都还处于早期阶段,Agent还没像传统应用那样大规模普及,大家其实都不知道完备的Agent Infra范式到底是什么样的。
比如为了提升 Agent 的智能化,需要一套支持数据缓存、回放、测试集管理的底层架构,这就要求改造 Agent 运行时环境,增强沙箱的数据暂存能力、网关的数据劫持功能,但目前行业还没系统推进这件事。
从简单的Chatbot到自主性Agent,再到Agent Infra的竞逐,未来 Agent Infra 还会怎么进化,会给市场带来哪些新变化,值得我们期待。
来源:健康小志一点号