阿里10团队8个月,重磅开源深度研究智能体Tongyi DeepResearch

B站影视 内地电影 2025-09-20 22:31 1

摘要:2025年9月17日,WebAgent项目改名为Tongyi DeepResearch又连发6篇论文,项目图里因此增加了6个更酷的小豹子。至今阿里Deep Research的智能体家族总共11个小豹子,刚好可以从之前的篮球队改行凑成一支足球队。

2025年8月,阿里通义有个Github开源多模态深度研究项目叫WebAgent,官方项目图里有5个小豹子,刚好组成一个篮球队。

2025年9月17日,WebAgent项目改名为Tongyi DeepResearch又连发6篇论文,项目图里因此增加了6个更酷的小豹子。至今阿里Deep Research的智能体家族总共11个小豹子,刚好可以从之前的篮球队改行凑成一支足球队。

通常Github开源AI项目中,一个项目对应一篇论文,阿里的这个Tongyi DeepResearch项目竟然足足发了11篇论文,可以看出阿里对这个深度研究项目的投入和重视远超其他AI项目。

这11篇论文,1-5是之前发的,6-11是9月17日同时发布的,一起看看9月17日发的6篇分别讲了什么重点。:

No.6 WebResearcher

No.7 WebResummer

阿里团队针对大语言模型智能代理在复杂网络搜索中的语境窗口限制问题,提出了ReSum无限探索范式。该方案通过定期摘要压缩对话历史、专门训练的摘要工具ReSumTool-30B和强化学习算法ReSum-GRPO,实现了4.5%-8.2%的性能提升,让AI能够处理需要大量多轮搜索验证的复杂查询任务。

No.8 WebWeaver

WebWeaver框架,让AI智能体能够像人类研究员一样进行深度调研。通过规划师和写作者的双智能体配合,实现了动态研究计划调整和分段式报告撰写,在多个基准测试中取得最佳成绩。

No.9 WebSailor-V2

研究展示了如何通过创新的合成数据构建和双环境强化学习方法,让30B参数的开源智能体在网络研究任务上达到甚至超越大型闭源系统的性能。WebSailor-V2在多个基准测试中创造了开源智能体的新纪录。

No.10 AgentFounder

阿里团队提出智能体持续预训练新方法,开发出AgentFounder-30B模型,通过在预训练和后训练间插入专门阶段解决传统智能体训练的优化冲突问题。该模型在十个基准测试中取得领先成绩,其中在HLE上达到31.5%成为首个突破30分的开源模型。

No.11 AgentScaler

团队通过创新的环境扩展方法,成功训练出AgentScaler系列AI智能体模型。该研究首次实现了小参数模型在工具使用任务上媲美大型模型的突破,其中30B参数的模型甚至能与万亿参数模型竞争。研究采用两阶段训练策略,先进行通用技能培养,再进行专业领域训练。

至顶AI实验室洞见

总的来说,Tongyi DeepResearch6个最新的研究分别解决“研究能力、记忆管理、知识整合、训练数据、推理效率与环境扩展”六大关键问题:1.AgentFounder 作为“研究大脑”,通过持续预训练为模型注入智能体直觉,奠定多步推理与工具调用基础;2.AgentScaler扮演“技能教练”,利用千级虚拟环境的两阶段训练,让小参数模型也能精通成千上万种工具;3.WebResearcher 是“迭代研究引擎”,以 Think–Report–Action 循环替代线性堆料,保证长程推理始终处于“清洁工作台”;4.ReSum 充当“记忆压缩器”,在超长搜索对话中定时生成关键线索摘要,实现语境窗口的“无限续航”;5.WebWeaver 是“双角色课题组”,规划师动态调整研究路线,写作者分段产出报告,形成类人深度调研闭环;6.WebSailor-V2 作为“数据与训练工厂”,通过 SailorFog-QA-V2 合成数据与双环境强化学习,为整个系统提供高质量、可扩展的训练燃料,并验证小模型也可比肩闭源大模型。

六大模块环环相扣:AgentScaler 与 WebSailor-V2 负责“练本领”,AgentFounder 提供“通用脑”,WebResearcher 与 WebWeaver 负责“做研究”,ReSum 保障“记得住”,共同支撑起DeepResearch 在开源领域媲美商业闭源系统的深度研究能力。

再看看每一篇的论文作者,会发现有一个名字重复出现:Jingren Zhou,也就是阿里副总裁、通义实验室负责人周靖人,也是最顶尖开源模型Qwen背后那个低调的男人。

从现在的时间点回想,也许在7月左右的一个普通上午,杭州某会议室里周靖人一声令下,6个团队的负责人带领着各自的团队投入研发,相约在9月带着各自的成果汇合。6个团队浴血奋战两个月,9月17日,Tongyi DeepResearch重磅发布!

(注:前边“7月左右”这个时间节点是本文作者推断出来的,因为WebSailor和WebSailor V2一作是同一个人,很可能是在7月第一个项目发布后立马投入V2的工作。)

Tongyi DeepResearch项目从25年1月的WebWalker开始,凝聚近10个团队8个月的心血,将一套完整的Agent系统开源给全球的开发者、企业,对全球深度研究Agent领域的发展影响深远。

项目地址:https://github.com/Alibaba-NLP/DeepResearch

模型地址:https://modelscope.cn/models/iic/Tongyi-DeepResearch-30B-A3B

来源:码客人生一点号

相关推荐