摘要:2025年3月,一款名为Manus的通用型AI Agent产品横空出世,迅速成为全球科技界的焦点。这款由中国创业公司蝴蝶效应(Butterfly Effect)推出的产品,既被捧为“AI应用爆发的信号”,也因技术能力不足、营销争议陷入舆论漩涡。其背后折射的,是
2025年3月,一款名为Manus的通用型AI Agent产品横空出世,迅速成为全球科技界的焦点。这款由中国创业公司蝴蝶效应(Butterfly Effect)推出的产品,既被捧为“AI应用爆发的信号”,也因技术能力不足、营销争议陷入舆论漩涡。其背后折射的,是AI Agent技术从实验室走向大众市场的关键转折点。
自3月初发布以来,Manus凭借“首个通用AI Agent”的定位引发轰动。其母公司蝴蝶效应随即启动新一轮融资,目标估值超5亿美元。产品仅通过邀请码内测,导致二手平台邀请码价格一度炒至数万元,开发者、投资人和用户争相测评。然而,热度背后争议不断:
尽管如此,Manus在研究(4分)和教育(4.5分)领域表现亮眼,尤其在信息检索、结构化输出(如表格生成)上接近人类水平。其在GAIA基准测试中,基础任务准确率达86.5%(接近人类92%),高级任务为57.7%,部分成绩超越OpenAI同层次模型。
二、AI Agent的技术跃迁与瓶颈Manus的争议本质反映了AI Agent技术发展的阶段性特征。根据行业分析,AI Agent需具备推理(Reasoning)、记忆(Memory)、工具使用(Tools)三大核心能力:
然而,Manus的瓶颈揭示了当前技术天花板:单智能体(Single Agent)虽能完成简单任务,但面对多步骤复杂流程时错误率叠加(如企业办公流程错误率达10%-20%)。行业共识认为,未来需突破多智能体协作(Multi-Agent)和统一通信协议(如Anthropic的MCP协议),才能实现亿级用户覆盖。
三、行业生态:从“自嗨”到普惠Manus的争议如同一记“叫醒铃”,警示从业者从“技术崇拜”转向用户体验。当前AI Agent生态可分为三大方向:
通用型产品:如Manus、Devin(编程Agent),直面C端用户但需平衡功能与易用性。基础设施层:LangChain、阿里云语义内核等工具包,降低开发门槛。垂直领域应用:编程:Cursor、Codeium助力代码生成,年收入破亿美元;客服与销售:Decagon处理70%工单,Clay成倍提升销售效率;医疗与科研:Epic自动化患者管理,Elicit服务200万科研人员。深圳市最新发布的《具身智能机器人产业发展计划》明确提出,2027年前培育10家估值百亿企业,推动AI Agent在50个十亿级场景落地。政策加持下,国产化进程加速,阿里、腾讯等巨头通过开源模型(如Qwen-32B、HunyuanVideo)赋能开发者。
四、未来:技术平权与生态重构OpenAI近期推出Agent开发API,预示行业将进入“Agentic”时代。专家指出,通用AI Agent难以覆盖所有场景,未来需依赖垂直领域Agent矩阵(如订票、保险、医疗等)协同。而底层技术的突破,如分布式多智能体框架、统一通信协议,将是实现“技术平权”的关键。
蝴蝶效应创始人表示,Manus将逐步开放工具链,赋能开发者探索机器人落地。与此同时,安卓前团队创立的/dev/agents公司已获5600万美元种子轮融资,致力于打造“AI版安卓”操作系统。
结语Manus的争议并非终点,而是AI Agent爆发的序曲。它验证了大模型底座的成熟,也暴露了从技术到产品的鸿沟。正如硅谷投资者所言:“To C端产品的终极考验,是让老爷爷老奶奶觉得好用。” 当行业从“堆参数”转向“真实需求”,AI Agent的黎明或许真的不远了。
来源:新浪财经