摘要:大模型时代,人人都想做智能体(Agent)。但真正动手搞过的人都知道,构建一个靠谱的 Agent,不只是把模型接上工具这么简单。你会一边加结构让它跑起来,一边又被这些结构拖住步伐。很多时候,看起来是“捷径”,其实是“陷阱”。
大模型时代,人人都想做智能体(Agent)。但真正动手搞过的人都知道,构建一个靠谱的 Agent,不只是把模型接上工具这么简单。你会一边加结构让它跑起来,一边又被这些结构拖住步伐。很多时候,看起来是“捷径”,其实是“陷阱”。
这不是个例,而是很多 AI 工程师都在经历的“集体苦涩”。而这背后,正是 Rich Sutton 所说的那个经典观点:人类设计的结构,终将被计算和数据碾压。
2023 年底,我在做一个面向科研场景的 Agent 项目。那时候,工具调用还不太稳定,大模型上下文也偏小。为了解决这两个痛点,我用了一个“编排器-工作器”方案。
简单说,就是一个 LLM 负责把任务拆成几个报告章节(编排器),再交给多个 LLM 并行去查资料、写内容(工作器)。最后把这些章节拼起来,就成了一份完整报告。
从效果上看,这套结构挺好用的:快、稳、模块化,适合部署。但现在回想,其实我一开始就给系统强加了不少“假设”:
报告一定可以拆成多个章节;
各个小模型之间不需要沟通;
工具调用靠不住,最好别用。
这些假设,在当时看是合理的,但也埋下了未来发展的隐患。
到了 2025 年,MCP(Multi-Call Planning)技术开始成熟,工具调用也越来越稳,甚至成为了 Agent 的标配。但我的系统因为“结构定死了”,没法快速跟上。
比如:
不能灵活规划流程,因为任务一定要拆章;
不能动态引入工具,因为我压根没设计这部分;
章节之间不能交流,内容经常割裂;
也就是说,新范式来了,我却被旧系统锁死了。
更尴尬的是,我当初加结构是为了“稳”,但现在这些结构成了“慢”和“不适配”的源头。新模型、新工具都用不上,Agent 越跑越像个流水线机器人。
意识到问题后,我开始重构系统。这一次,我尝试最小化结构,最大化模型的自由度。
不再强制分章节,而是让 Agent 根据任务自由组织结构;不再并行写作,而是先做信息收集,再统一生成;引入工具调用和共享上下文,让子 Agent 之间能交流、协作;最终,我用这个新系统跑了一个公开基准测试(Deep Research Bench),得分 43.5,进入前 10(而且没用 RL,也不是大厂项目)。这意味着什么?结构放松了,Agent 反而跑得更好。
这也印证了 Hyung Won Chung 的观点:“结构是暂时的,拆除才是最终目标。”
这个过程带给我几个教训,可能对你也有启发:
结构是必要的,但要随时准备拆掉它。刚开始我们需要结构来跑通系统,但一旦模型能力更强、工具更好,你就要敢于打破这些“稳定”。不要把现阶段的不足写死在架构里。
比如,工具调用不稳定时可以绕开用,但别把“永远不用工具”写进系统逻辑。未来一旦工具升级,你就没法跟上了。设计要“松耦合”,方便替换和演进。
我现在用 LangGraph 做 Agent 编排,但只用它最底层的构件(节点+边),这样可以随时重构,不被抽象层困住。AI 工程不是“搭积木”,是“养生态”。
你不是在拼一个死板系统,而是在构建一个能随着模型成长而进化的生态系统。
AI 工程的很多失败,并不是因为技术太差,而是因为我们太早“定型”了。
我们以为在加速,实际上是把系统钉死在了某个能力阶段。模型变了,工具变了,环境变了——而我们还在用旧地图找路。
所以,结构不是问题,僵化才是。
构建 Agent 的苦涩教训在于:你必须不断拆掉你曾经精心构建的一切。
而这,恰恰是最难的事情。
来源:亓钦