摘要:近日,360集团(以下简称“360”)AI产品“纳米AI”迎来了双升级,品牌由“纳米AI超级搜索”升级为“纳米AI”,产品能力从“超级智能体”升级为“多智能体蜂群”,首次实现多智能体拉群组队、像蜂群一样分工协作,依靠群体智慧全自动完成复杂任务,直接交付专家级结
多智能体最重要的是能够调动多个智能体灵活组队,共同完成复杂的任务。360的多智能体纳米蜂群,类似于蜂群的有机组织,不仅有角色的分工,还可以相互协作。
文|王雅迪
近日,360集团(以下简称“360”)AI产品“纳米AI”迎来了双升级,品牌由“纳米AI超级搜索”升级为“纳米AI”,产品能力从“超级智能体”升级为“多智能体蜂群”,首次实现多智能体拉群组队、像蜂群一样分工协作,依靠群体智慧全自动完成复杂任务,直接交付专家级结果。
在ISC.AI 2025第十三届互联网安全大会上,360集团创始人周鸿祎强调,2025年是智能体元年,智能体会成为AI的主角,当前智能体是个开始,下一步将演变成智能体蜂群、集群。一个公司刚开始可能会有若干智能体干活,慢慢智能体多了会有智能体部门,会改变个体工作方式与价值创造模式,改变企业的组织运营模式,重塑整个经济的形态和运营逻辑。
据悉,360的纳米AI多智能体蜂群的技术和定制搭建来自360智能体工厂,其打破了目前流行的多智能体协作容易陷入“三个和尚没水喝”的困境,通过蜂群协作框架完成复杂任务。
01
L4级别的“多智能体蜂群”
以前的单智能体如Manus虽然能做出前端网页、PPT,但深究发现,做复杂工作的时候单智能体会受到很多制约,所以出现了多智能体。
据悉,360集团模仿自动驾驶技术给智能体划分了五个级别,纳米AI多智能体蜂群出现之前,智能体一共经历从L1到L3的三个发展阶段。
L1是聊天助手,例如ChatGPT、GPTs、Character AI,通过提示词来做角色扮演,通过聊天实现与人的交流,很多情感陪伴的智能体是最早期的智能体;L2叫工作流智能体,在此过程中,更多的还是基于编程思路,利用低代码平台调用各种工具模型、知识库,把一个任务流程固化下来,这里大模型的能力是附属在流程之内的;L3叫推理型智能体,如Manus、纳米之前做的超级搜索智能体,完全用大模型驱动,由大模型自主规划任务流程,不需要告诉详细的工作流程,只要告诉工作目标、职责,大模型对用户要求进行理解。
到了L4便是以纳米AI为代表的多智能体蜂群,以前的单智能体如Manus虽然能做出前端网页、PPT,但深究发现,做复杂工作的时候单智能体会受到很多制约,所以出现了多智能体。
然而,360集团实测证明,在目前流行的多智能体技术框架下,无法解决任务分配、参数传递、上下文管理等问题,实现有效的团队协作。单个智能体成功率如果达到九成,多个智能体协作的成功率甚至要降至五成以下。多步骤工作流里的错误率,是以指数方式复合叠加的。比如模型跑一步有95%的可靠性,而跑20步成功率就只剩下仅约30%。上述问题不解决,多智能体协作将陷入“三个和尚没水喝”的困境,1+1效果远远小于2。
周鸿祎表示:“多智能体最重要的是能够调动多个智能体灵活组队,共同完成复杂的任务,我们的多智能体之所以叫纳米蜂群,就是类似蜂群的有机组织,不仅有角色的分工,还可以相互协作,所以说并不是有多个智能体聚在一起就叫多智能体,需要有机协作。”
具体来讲,L4智能体蜂群是在L3基础上增加了协作机制,就像招员工一样,把一批人才组合在一起,如果不派一个老板和项目经理给大家统筹指挥,就会出现单兵作战的情况。因此,既有指挥和控制的机制,也有智能体之间的信息共享、任务并发的机制。
为此,周鸿祎对L3智能体提出三个重要的指标:一是上下文的管理能不能连续消耗100万个Tokens;二是多步执行的时候稳定执行100步不出错;三是多工具调用,就是能不能同时调用100个工具。
据悉,360集团打造的蜂群式调度中心实现了比较亮眼的性能指标。目前能够连续执行1000步,每次的任务Token消耗在500万—3000万,任务成功率达到95.4%。
至于L5智能体的定义,即ACA智能体(agent-creat-agent),可以打造智能体的超级智能体。周鸿祎坦言:“第五级别行业在争论,定义不太一样,(这是)我自己的理解,现在的智能体是人来定义,无论是L3、L4都需要人把自己的经验告诉智能体,以后的超级智能体和我们聊天就能规划出L2、L3智能体,这也是人工智能自我进化的领域,而L5大家都还在探索。”
通俗来讲,L1智能体好比是个玩具,能看能玩,但不能作为生产力工具使用;L2工作流智能体则类似于工具,可以提升工作效率,但本质上还是以人为主导在干活;L3推理型智能体则相当于已经拥有专家级员工干活;而到了L4多智能体蜂群,就好比雇用了一个分工明确、紧密协作的团队工作,只要操作者愿意,甚至可以无限扩展这个团队的规模,从而快速拿到结果、达成目标。
02
“一句话成片”,能成吗?
目前“一句话成片”主要是应用设计的深度和算力成本的平衡问题,现在多角色的复杂剧情交互还不是行业内的主流需求。
截至目前,360的多智能体蜂群中已有超过5万个L3级推理智能体。在“蜂群”框架下,这些智能体可以组合成L4团队,在一套指挥系统下,目标一致、步调一致地执行任务,最终完成超长的复杂任务,比如制作一个长达 10 分钟的影片,这也是其主推的功能之一。
据介绍,“一句话成片”功能的视频生成流程可分为11个步骤,全部自动化执行:
第一,意图分析;第二,信息采集,基于主题自动在多个平台搜集相关数据;第三,结构规划,自动设计视频的整体框架和叙事顺序;第四,脚本生成,支持自然语言输出;第五,图像生成,调用MCP(多智能体通信协议)工具自动创建与主题匹配的高质量图片素材;第六,AI旁白配音;第七,视频片段创建,将生成的图片转化为动态视频片段;第八,音频字幕匹配;第九,素材拼接;第十,背景音乐选取;第十一,音乐集成,完成最终可交付的视频输出。
接受媒体采访期间,周鸿祎向《商学院》杂志表示,通常做视频不是光产生视频,要有分镜,通常一个视频有上百个分镜,所以单智能体目前碰到的局限就是100步需要100个工具、100万个Tokens。纳米AI的多智能体蜂群目前能走到1000步,大概能做到10分钟,这个上限还可以继续推动,目前10分钟的视频大概用了十几个智能体。
同时,周鸿祎坦言:“人和人的对齐是很难的,智能体和智能体的对齐也是很难的。尽管我们做的是‘蜂群’,因为蜜蜂的工作分工比较简单,两个级别就可以,但模拟人类的级别还有很大挑战,当有1万个智能体时,考虑是否要有SVP级别的智能体,有了SVP就要有EVP,因此还需要进一步探索,但多智能体一定是未来。”
《商学院》杂志观察发现,在360集团演示的生成视频中,单一角色可以实现同步配音,当人物角色多了以后,演示视频以旁白声音为主。对此,周鸿祎也坦言:“(在配音上)还不能算完美,我们现在正在增加几个配音的智能体,来解决多个人物配上不同声音的问题。”
企业网络安全专家联盟秘书长张威向《商学院》杂志表示,目前“一句话成片”主要是应用设计的深度和算力成本的平衡问题,现在多角色的复杂剧情交互还不是行业内的主流需求。因此,当前多角色通过旁白来替代角色声音是暂时性的解决方案,只要增加算力,增加智能体的工作流,基本就能实现。
03
周鸿祎的AI蓝图
每个公司、每个人更应该想一想,当有了一堆数字员工、数字专家、数字团队,怎么样让它在企业的产品内部业务流程中发挥重要的作用。
从2023年开始,周鸿祎便将“ALL IN AI”定为公司的核心战略,并首次公开提出企业家要建立“AI信仰”,相信大模型是真AI的一次突破,大模型是工业革命级的技术,所有行业都会被大模型重塑,没有拥抱大模型的企业和个人都将被淘汰。
此后的两年多时间里,周鸿祎多次在公开场合提及拥抱AI的重要性,并带领360集团“ALL IN AI”。
2023年3月,360智脑大模型1.0版本发布,并于6月快速升级至4.0版本,数字人、多模态应用、360全端应用等成果落地。同年11月4日,360大模型“奇元大模型”通过备案落地,商业化和产品定位以B端用户为主。2024年6月,360发布AI搜索,并于同年11月正式发布多模态内容创作引擎“纳米搜索”。
直至今年,纳米AI搜索已进化为“纳米AI超级搜索”,这一新形态不仅是一个搜索引擎,更是一个具备自主思考与任务规划能力的智能体,能够自动调用各类工具完成复杂任务,如今更是升级为“多智能体蜂群”,成为全球首个真正迈入L4级别的智能体系统。
近两年,周鸿祎本人也通过直播讲课、高校分享等方式频繁出现在公开场合,分享他对于AI发展趋势的洞察,以及企业如何拥抱AI的建议。通过打造个人IP形象,周鸿祎从“红衣教主”逐渐变成AI “布道者”。
在周鸿祎看来,未来,人机交互的范式会发生根本改变。用户和智能体进行交互,用户会变成智能体的老板、领导者。智能体将学会使用软件和工具,用户以后不再关心自己使用什么软件和工具,现在所有的网站、APP将来会改变,变成不让人操纵而是让智能体做事。
针对多智能体协作的过程中可能带来的“指数级错误的叠加”的问题,张威认为:目前来说还不会出现这种问题,当前的智能体尚不复杂,其发展的目标是能替代一部分人类在已成熟领域的重复性劳动,从而作为人类工作的辅助工具。因此,当前智能体输出的错误内容可以通过人类的监督来消除,这样就能控制项目整体的输出成果是可控的。短期内指数级错误的叠加还不是问题,但未来当有更复杂的智能体出现时,尤其是应用到机器人的实操场景中,还会不会变成问题,有待观察。
以AI制作电影的场景为例,目前并不能让智能体一键全部完成一部90分钟电影,从故事—剧本—分镜脚本—分镜拍摄—剪辑—特效等整个过程,但在人类的监督下,分阶段可以让AI来实现,如写剧本、分镜,主角人像设计、动态分镜头视频生成。最后只要人类把分镜头根据最初的想法进行剪辑和修订就可以了,整个过程还是需要人参与其中的审核和决策环节。
对此,周鸿祎指出,360设立了两个功能:一是单智能体做完一个工作后有自我反思能力,自我校正一下;二是设立专门做校正的智能体角色,统一做校验。以图生视频为例,在图生视频之前要专门有一个审稿者,用视频模型把图再解读一遍,以此出来的画面解读和文生图的提示词再对一遍,没有大的差异,这张图才做成。用类似的细节方法来极大提高正确率。
据悉,自从360有了智能体工厂之后,其AI搜索、AI浏览器及各种安全产品,全部都在ALL IN AGENT。用周鸿祎的话来说:“公司内部不一定要裁人,员工有了智能体之后,至少可以多点休闲时间摸摸鱼,要不然没时间摸鱼,没时间平衡家庭和生活。我们要求各个部门都打造自己的智能体,只要人能干的事就要看有没有智能体可以自动化或者半自动化。”
对于周鸿祎来说,今年不管做什么业务都要ALL IN AGENT。他表示,安全行业每个公司、每个人更应该想一想,当有了一堆数字员工、数字专家、数字团队,怎么样让它在企业的产品内部业务流程中发挥重要的作用。
04
用多智能体破解安全问题
在需要准确性比较高的智能体协作场景中,如何识别、检测、验证智能体输出的结果是正确、准确的,会一直成为这个领域需要克服的问题。
相比单一智能体,智能体的协同工作涉及多个环节,每一个环节都可能触发用户数据的收集、存储、调用、跨主体交换。
南方财经发布的《智能体体检报告——安全全景扫描》问卷调研显示,AI幻觉与错误决策(72%)、数据泄露(72%)、有害内容输出(53.5%)是行业最普遍关心的三个安全合规问题。如果出现了安全合规事件,行业最担心的后果是用户数据泄露(81.4%)以及非授权操作带来的业务损失(53.49%)。也有一部分人担心被监管调查或处罚(44.19%)。
张威表示,智能体协作框架涉及工作流及AI大模型SAAS服务的整合,应用成熟后面临的网络安全问题主要有以下几个方面:
一是内容版权和保密问题。如何让内容创作者放心地应用智能体来生产内容,产出的内容是否存在版权纠纷;二是智能体的技术漏洞问题。智能体涉及复杂的软件集成,其中可能面临大量的漏洞,利用漏洞完全可以破坏智能体工作机制,或在工作流中植入病毒;三是AI供应链安全问题。智能体会借助不同来源的AI大模型来实现预设的功能,这其中涉及众多服务商或供应商,可能会涉及智能体功能的提供,任何一个关键供应商的权限被滥用或出错,都有可能造成智能体出现问题;四是幻觉问题。在需要准确性比较高的智能体协作场景中,如何识别、检测、验证智能体输出的结果是正确、准确的,会一直成为这个领域需要克服的问题。此外,诸如合规和伦理类问题还有待观察。
在周鸿祎看来,智能体对安全的挑战则主要有两个方面:一是中国一直缺乏安全运营专家的困境,不存在饭碗过剩的问题,很多饭碗没人端。智能体如果能打造出来,本质就是安全运营专家的替身,每个企业只要有算力就可以部署几十个甚至上百个安全专家智能体,拥有虚拟安全专家,有效地弥补人才缺失的短板。
另一个严峻形势是智能体黑客的出现。现在有些国家的黑客组织已经开始考虑利用大模型,它既可以是好用的工具也可以是坏人的帮凶。只要有算力,它就可以批量复制,复制成千上万个黑客,而且黑客不用吃饭、睡觉。智能体黑客可以利用工具自动完成攻击的规划、漏洞的发掘、攻击工具的撰写和使用。人类黑客可以管理几十个、上百个智能体黑客成为超级黑客,智能体黑客在今年会大批出现,使得过去网络安全人跟人的对抗变成人和机器、人和算力、人和算法的对抗,可能会改变网络战的形态。所以只有以模制模才是安全的解决之道。
对此,360对安全智能体提供了较为丰富的使用方式,企业可以直接使用开箱即用的安全智能体,用户觉得效果不满意还可以定制安全智能体,甚至可以把已有的智能体和自己的智能体重新组队。同时,还提供了智能体工厂,企业除了在安全智能体上,将来在业务管控、企业服务、企业营销方面都可以用智能体工厂打造自己的智能体。
实际上,这也是纳米AI社区的重要优势之一。如果企业在纳米AI社区没有找到合适的智能体“人才”,可以基于360智能体工厂实现零代码定制智能体,而用户只需要用自然语言写出“岗位说明书”,就能打造出自己的AI智能体专家团队。
来源:商学院杂志