比R1快8倍、价格仅3%,智谱的智能体会自己挣钱!下月开源

B站影视 港台电影 2025-04-01 17:27 1

摘要:3月31日,中关村论坛上,智谱展示了一段令人震撼的Demo:用户仅需输入“用你最擅长的方式,帮我赚100块钱”的指令,AutoGLM沉思便自主打开知乎、小红书等平台,通过多轮自我反思与纠错,最终选择撰写科普文章和设计调查问卷的方案。这一过程全程无需人工干预,展

智谱发布最新 Agent 产品“AutoGLM 沉思”,这个融合深度研究(Deep Research)与实战操作(Operator)于一体的智能体还能自己赚钱!

3月31日,中关村论坛上,智谱展示了一段令人震撼的Demo:用户仅需输入“用你最擅长的方式,帮我赚100块钱”的指令,AutoGLM沉思便自主打开知乎、小红书等平台,通过多轮自我反思与纠错,最终选择撰写科普文章和设计调查问卷的方案。这一过程全程无需人工干预,展现了AI从认知到执行的完整闭环。

更引人注目的是,智谱在两周前启动了一项秘密测试。通过AutoGLM沉思运营的小红书科普账号,在生成咖啡壶选购指南、化妆品成分对比等内容后,两周内收获5000粉丝,并成功接洽首条商单,赚取500元收入。这一案例不仅验证了AI Agent的实用性,更揭示了其商业化落地的可能性。


技术突破:让机器学会“边想边干”

AutoGLM沉思的核心突破,在于实现了“思考-行动”的动态闭环。智谱研究员刘潇将其能力拆解为三大特性:

深度思考:基于GLM-Z1-Rumination模型,通过强化学习模拟人类决策过程,支持超过20步的连续推理;

环境感知:突破API依赖,直接解析网页图文信息,像人类一样浏览知网、小红书等非开放平台;

工具调用:整合自研AutoGLM设备操作能力,可自动完成报告生成、邮件发送等复杂任务。

这一技术架构的演进路径清晰可见:从GLM-4基座模型出发,经推理模型GLM-Z1-Air优化,最终通过强化学习训练出具备“自我反思”能力的GLM-Z1-Rumination模型。其中,32B参数的GLM-Z1-Air以每秒200 tokens的生成速度,达到DeepSeek R1的8倍性能,而成本仅为1/30。这一突破性性价比,使其可在消费级显卡运行,极大降低开发门槛。

与OpenAI的DeepResearch相比,AutoGLM沉思的差异化在于“多模态理解+自主操作”的融合。在斯坦福AgentBench评测中,其网页交互能力超越GPT-4o和Claude-3.5-Sonnet,手机端任务成功率提升超20%,展现出行业领先的工具调用能力11。


商业化破冰:从实验室到真实世界的价值创造

AutoGLM沉思的发布,标志着AI Agent从技术概念走向商业落地的关键转折。智谱CEO张鹏在访谈中透露,当前版本对5-10步简单任务的成功率已达80%-90%,复杂任务的完成度也在快速提升。这种进步背后的驱动力,正是智谱提出的“Agent Scaling Law”——通过扩展训练时的计算量,智能体性能呈现指数级提升。

这一规律在商业场景中已初见成效:

内容创作:通过自主研究、跨平台信息整合,实现小红书/知乎等平台的精准内容输出;

企业服务:在金融、咨询领域,可完成行业报告撰写、数据深度分析等高价值任务;

消费级应用:用户可通过自然语言指令,实现跨APP的复杂操作,如“比价三家电商平台后下单最优商品”。

值得关注的是,智谱选择在4月14日开源核心模型与技术,并推出完全免费的GLM-Z1-Flash推理版本。这种“开放生态+分层服务”的策略,或将加速AI Agent在开发者社区的普及,形成类似Anthropic MCP协议的行业标准。

AutoGLM沉思的诞生,不仅是一次技术迭代,更是对人机关系定义的重新探索。当AI能够自主研究、决策并创造经济价值时,人类角色必然从“操作者”转向“目标制定者”与“价值评判者”。这种转变带来的不仅是效率革命,更是对劳动力结构、商业模式的深层重构。

来源:IT168企业级

相关推荐