摘要:这款深度研究Agent模型一出来,直接在好几个权威榜单上拿了第一,连OpenAI、DeepSeek这些对手都被甩在了后面。
阿里旗下的通义DeepResearch最近搞了个大动作,正式开源了。
这款深度研究Agent模型一出来,直接在好几个权威榜单上拿了第一,连OpenAI、DeepSeek这些对手都被甩在了后面。
说实话,在AI圈里,参数规模以前总被当成硬指标,本来想这次通义能登顶,参数肯定小不了,但后来发现它就30B参数,实际激活的才3B,这么轻量还能有这成绩,是真的让人意外。
通义DeepResearch在HLE榜单上的表现特别突出,这个榜单被业内称为“人类最后的考试”,能在上面拿高分,意味着模型解决复杂问题的能力很强。
它在这上面的成绩,比OpenAI、DeepSeek的同类模型都高不少。
另外在OpenAI提出的BrowseComp榜单上,它的准确率也排在开源模型的第一位。
更让人惊喜的是,阿里这次特别慷慨,模型、框架、方案全开源了。
开发者想用上它,去HuggingFace、GitHub或者ModelScope就能下载。
GitHub上的项目刚上线没多久,就被星标了7.2k次。
HuggingFace的联合创始人兼CEOClemDelangue,还有斯坦福NLP实验室这些行业里的大V,都第一时间转发关注了这事。
老实讲,以前AI圈里不少好模型都是闭源的,中小企业想搞AI研发,要么拿不到好模型,要么成本高得吓人。
之前看Linux基金会的报告说,89%的企业更愿意用开源AI,就是因为开源能降低门槛。
通义这次全量开源,相当于把“深度研究”的技术大门给更多人打开了。
中小企业不用再花大价钱去买商业模型授权,拿通义的开源成果改一改,就能搭建自己的智能体,这对整个行业的普惠发展帮助真的很大。
DeepResearch能这么厉害,背后的技术路线很关键。
首先是数据这块,大模型的智能程度,跟训练数据的质量、数量直接挂钩。
以前很多模型靠人工标注数据训练,又贵又慢,还容易有误差。
通义团队搞了套“智能体合成数据”体系,从预训练到后训练全用上了。
他们先搭了个“开放世界知识记忆库”,把海量文档、网页数据、知识图谱这些都装进去,再从里面抽知识点,自动生成“问题-答案”对。
还专门造了规划、推理、决策三类“动作数据”,让模型在不用调用昂贵在线API的情况下,就能练出解决问题的思路。
到了后训练阶段,又升级出WebSailorV2这种全自动数据生成方案,从真实网站里提信息,还会故意增加问题难度,甚至能造出“博士级”的跨学科难题。
这么一套流程下来,模型拿到的“教材”质量又高又多,比人工标注高效太多了。
推理模式上,它也玩出了新花样。
一般模型处理任务就一种模式,通义却有两种。
平时处理标准任务用ReActMode,就是“思考-行动-观察”的循环,靠着128k的超长上下文,多轮交互都很顺畅。
碰到特别复杂的长任务,就切换到HeavyMode。
说实话,之前看谷歌、OpenAI的模型处理长任务,总容易出问题,所有中间信息都堆在一个“窗口”里,越堆越乱,最后模型都没法集中注意力,这就是业内说的“认知空间窒息”。
通义的HeavyMode就不一样,它会把大任务拆成好几轮“研究”,每轮只从上一轮里挑最精华的结论,重新搭个简洁的“工作空间”,在里面分析问题、整合报告,最后再决定下一步该干嘛。
这么一来,不管任务多复杂,模型的思路都能保持清晰,推理质量自然降不下来。
DeepResearch可不是实验室里的“花瓶”,现在已经用到阿里的不少产品里了。
高德地图就是个典型例子,前段时间高德升级到V16版本,重点推“地图导航+本地生活”,背后就有通义的技术加持。
团队给高德定制了个“POI推理Agent”,特别懂地图领域的需求。
比如有人说“想在西湖边上找家评分4.5以上的浙菜馆,得有儿童餐,从地铁站走过去不能超过1公里”,这个Agent能瞬间把符合条件的餐馆挑出来,连路线都安排得明明白白。
要是想去奥森Citywalk,它还能马上出三种攻略,每种都有详细的时间规划,推荐餐饮和景点,比自己查攻略省心多了。
在法律领域,它也跟“通义法睿”深度融合了。
通义法睿是个原生法律智能体,能问答、查案例、审合同、写文书。
升级之后,靠着通义的DeepResearch能力,它能做多步查询,引用的判例、法规都能追溯来源,分析过程也更严谨。
之前看行业测试,在答案要点、案例引用、法条引用这三个核心维度上,它比OpenAI、Claude的同类功能表现都好,律师用起来也更放心。
说到底,通义DeepResearch这次开源,对AI圈来说真是个大福利。
它不仅证明了轻量模型也能在“深度研究”领域称王,还把数据合成、强化学习这些核心技术思路公开了,相当于给行业指了条新路子。
以后说不定会有更多人用它做出爆款应用,毕竟现在人人都能基于它搭自己的深度研究智能体了。
这么看来,阿里这次是真的在AI领域“上大分”了,也给整个行业的发展添了把劲。
来源:墨史浅吟