Agent 也有 Scaling Law!智谱发布首个“边想边干”的 Agent

B站影视 内地电影 2025-03-31 18:44 1

摘要:北京时间 3 月 31 日,近期几度融资的智谱在中关村论坛上正式发布「AutoGLM 沉思」—— 一个能探究开放式问题,并根据结果执行操作的自主智能体(AI Agent)。它能够模拟人类的思维过程,完成从数据检索、分析到生成报告。

出品 | CSDN(ID:CSDNnews)

2025 年是 Agent 爆发之年已成共识,由 Agent 和推理模型带来的强调应用智能程度的 Agentic AI(自主式 AI)大行其道。

北京时间 3 月 31 日,近期几度融资的智谱在中关村论坛上正式发布「AutoGLM 沉思」—— 一个能探究开放式问题,并根据结果执行操作的自主智能体(AI Agent)。它能够模拟人类的思维过程,完成从数据检索、分析到生成报告。

值得关注的是,AutoGLM 沉思不仅具备深度研究能力(Deep Research),还能实现实际操作(Operator),真正推动 AI Agent 进入“边想边干”的阶段。并且免费、不限量,在智谱清言 PC 客户端已经上线,可以直接体验其研究能力和操作能力。

智谱 CEO 张鹏表示,此次发布的为 preview 版本,核心支持 research 场景;在未来两周,将进一步扩展更多智能体执行能力。包括推出“虚拟机”版本,进一步增强 AI Agent 的实际落地能力。

除此之外,他还预告:2025 是智谱开源年,在 4 月 14 日,智谱的基座模型 GLM-4-Air、推理模型 GLM-Z1-Air、沉思模型 GLM-Z1-Rumination 均将开源。

当 AI 学会自己搞钱

在发布现场,张鹏首先以 Demo 展示了 AutoGLM 沉思的效果,颇引人关注。

14 天前智谱秘密开展了一项测试:注册一个小红书账号,专注于生活科普。用新的 Agent 生成了笔记,比如怎么选咖啡壶、怎么做化妆品成分对比等。有些任务可真不简单,像化妆品成分对比,要调查 2025 年最火的三大抗老成分,比对它们的作用、用法、优劣势,最后还要做严谨的比对分析。

最终,这个小红书账号收获了相当令人艳羡的成绩:“两周时间我们收获了 5000 粉丝,接到多条商单邀请,昨天,我们发出了第一个商单,赚了 500 块钱。”

其背后依赖于 AutoGLM 沉思的三个关键技术:

深度思考:能够模拟人在面对复杂问题时的自主决策过程。

感知世界:能够像人一样获取并理解环境信息。

工具使用:能够像人一样调用和操作工具,完成复杂任务。

AutoGLM 沉思背后的模型,是智谱全新推出的 Agent 大脑——沉思模型,即通过强化学习,让模型学会自我批评、反思、甚至沉思,并通过更长的深度思考时间换取更优的效果。

沉思突破了实时联网搜索、动态工具调用、深度分析和自我验证,实现真正的长程推理和任务执行。

AutoGLM 沉思的技术演进

张鹏对AutoGLM 沉思的技术演进路径进行了披露,包括:在 GLM-4-Air 基座模型的基础上,训练出推理模型 GLM-Z1-Air,基于 Z1 模型,结合工具使用和完成长程推理能力,训练出沉思模型,来作为 AutoGLM 沉思的大脑。最后集成了智谱自研的智能体技术 AutoGLM,成为 AutoGLM 沉思的手脚。

其中推理模型 GLM-Z1-Air 拥有比肩 DeepSeek R1 的推理性能,极速版的速度有 8 倍提升,而价格仅需 R1 的 1/30。

而基座模型 GLM-4-Air 在预训练阶段,加入了更多的代码类、推理类数据;并在对齐阶段,针对 Agent 能力进行了对齐,使其更擅长工具调用、联网搜索等 Agent 任务。这款模型只有 32B 的参数量,能力却比肩更大参数量的国内外主流模型。

大模型的预训练和后训练存在 Scaling Law。然而,不只是大模型推理满足这一规律,智谱发现,Agent 也存在类似的 Scaling Law。

对于 Agent,通过扩展训练时的 inference compute,智谱模型团队观察到 Agent 展现出了更强的性能。

这一 Agent Scaling Law 的背后,是智谱的自进化在线课程强化学习算法框架——WebRL。通过设计由易到难的任务序列,逐步引导模型从简单场景向复杂场景过渡学习,从而提升训练效率和最终性能。这种方法模拟人类学习过程,通过动态调整任务难度,帮助模型积累基础能力后再挑战高难度任务,有效避免直接处理复杂问题时的训练不稳定。

在 Agent Scaling Law 的基础上,智谱进一步发现了 Agent 存在的能力涌现。比如在训练过程中,从未教给 AutoGLM 沉思访问过巨潮资讯网。然而,当发送指令“帮我收集昨天关于具身智能的相关研报”时,却惊喜地发现, AutoGLM 沉思能够规划出通过访问巨潮资讯解决问题的方案,并顺利操作了网站。

最后,智谱在 2025 年将怎么走是大家很关注的话题,张鹏这样说道:“智谱始终专注于 AGI 基座模型的研发,目前已经探索到 L3-Agentic LLM 阶段,我们将 GLM 一系列 Agent 能力,统称为 Agentic GLM。未来很长一段时间内,智谱将聚焦 Agentic GLM 的研发。”一起期待。

4 月 2 日 20:00,CSDN《万有引力》栏目特别邀请到 OpenManus 项目一作、MetaGPT 开源核心贡献者梁新兵,DeepWisdom 算法研究员、OpenManus 核心作者向劲宇相聚 CSDN 视频号直播间,在 CSDN &《新程序员》执行总编、《万有引力》主理人唐小引主持下,一起聊聊 00 后程序员的故事,以及 OpenManus 背后的秘密!

来源:CSDN一点号

相关推荐