摘要:其中,2025年3月初,智谱AI宣布近期完成新一轮金额超10亿元人民币的战略融资,参与投资方包括杭州城投产业基金、上城资本等。3月中旬,珠海华发集团宣布斥资5亿元战略投资智谱AI ,推进智谱基座GLM大模型的技术创新与生态发展。珠海联合智谱搭建首个城市级GLM
雷递网 乐天 3月31日
2025年以来,智谱在资本方面动作很多,相继与北京、杭州、上海、成都、珠海等在内的地方政府达成合作。
其中,2025年3月初,智谱AI宣布近期完成新一轮金额超10亿元人民币的战略融资,参与投资方包括杭州城投产业基金、上城资本等。3月中旬,珠海华发集团宣布斥资5亿元战略投资智谱AI ,推进智谱基座GLM大模型的技术创新与生态发展。珠海联合智谱搭建首个城市级GLM大模型空间——“智谱+珠海华发空间”。
智谱CEO张鹏在今日的发布会上表示,在城市生态方面,自主、安全、低幻觉的GLM大模型依然是城市首选的模型厂商。智谱与当地龙头企业携手,推动地方大模型应用生态的建设。
“比如在珠海,我们和珠海龙头企业华发集团联合搭建首个城市级GLM大模型空间——“智谱+珠海华发空间”,将智谱一系列语言、多模态等端侧模型部署到各个设备。类似的落地还有很多。”
以下是智谱CEO张鹏演讲核心内容:
此时,这个Agent开始了一轮一轮的灵魂拷问:
我到底擅长啥?我们看到不同于一般的推理模型,这个Agent的思维链很长,它一直在不断的思考、反思、纠错。
然后Agent发现自己可能可以通过写作,或者调查问卷之类的方式赚到钱。这个时候它开始思考,我该去哪里搜各种征稿?
在这个过程中,它自己在不断打开知乎/小红书搜索,自己输入要搜索的信息、自己选择好筛选条件,然后就是一页页浏览网页内容和图片,再选择自己需要的。
大家可以看到,这个Agent不论是思考过程,还是动手上网的方式,都和人非常像了。
它因为要不断的推理规划、反思、查询、调用工具,所以这个过程它大概要走10几分钟。
由于时间关系,我们就先把它放在一边。一会再来揭晓,是翻车了还是成功了。
大家在线上用的时候,也可以随时把它扔在后台,不管它,让它自己慢慢探索。
相信这是大家很多人都是第一次见到,
Agent 在我的电脑上,自己动手在上网。
真的在认认真真的干一件事儿。
这里还有另一个赚钱的例子,14 天前我们秘密开展了一项测试。我们注册了一个小红书号,专注于生活科普。我们用新的Agent生成了笔记,比如怎么选咖啡壶、怎么做化妆品成分对比等。有些任务可真不简单,像化妆品成分对比,要调查 2025 年最火的三大抗老成分,比对它们的作用、用法、优劣势,最后还要做严谨的比对分析。
现在为大家揭晓一下这个小红书账号的成绩:两周时间我们收获了 5000 粉丝,接到多条商单邀请,昨天,我们发出了第一个商单,赚了500块钱。
今天,我们要发布的这个产品,叫 AutoGLM 沉思。名字听起来有点高冷,行为却特别主动。
沉思不是 Chatbot,也不是 AI 搜索。它的最小输入单位,是“任务”。
下面让我们再通过一个视频,看看AutoGLM沉思是如何帮助专业人士直接完成任务的。
智谱成立的愿景,是让机器像人一样思考,今天我们更希望让它像人一样思考和行动,实现AI与物理世界的交互。
刚刚大家看到的视频和demo,来自我们全新推出的Agent——AutoGLM 沉思。它是首个集深度研究能力和网页操作能力于一体的Agent。复杂问题,边想、边干。
这一能力的实现依赖于三个关键技术:
深度思考:能够模拟人在面对复杂问题时的自主决策过程。
感知世界:能够像人一样获取并理解环境信息。
工具使用:能够像人一样调用和操作工具,完成复杂任务。
此次发布的为 preview版本,核心支持 research 场景;
在未来两周,我们将进一步扩展更多Agent的执行能力。
为什么叫AutoGLM 沉思,因为在AutoGLM 沉思背后的模型,是我们全新推出的Agent大脑——沉思模型,即通过强化学习,让模型学会自我批评、反思、甚至沉思,并通过更长的深度思考时间换取更优的效果。
沉思突破了实时联网搜索、动态工具调用、深度分析和自我验证,实现真正的长程推理和任务执行。
比如这个prompt“写一篇报告,关于哪吒2票房的成功将会给中国电影行业带来怎样的改变。”沉思模型很擅长做这类开放性的问题,需要模型自己去探索,最后它生成了近万字的报告。
智谱很早便布局AI Agent,甚至早过 OpenAI 和 Anthropic,我们率先提出 Phone use(AutoGLM),也几乎与 Anthropic 在同一时间发布了 Computer use。
从Agent发展历程来看,智谱始终在创新。
从2023年10月最早推出具备Function Call能力的智谱清言,
到2024年1月率先上线支持智能体编排的GLMs,
再到2024年10月推出全球首个设备操控智能体AutoGLM,
以及今天推出我们最新的自主智能体AutoGLM沉思,
智谱一直在引领对 Agent 上限的探索。
同样, AutoGLM也不是一蹴而就的,
它的动脑、动手、能看见,背后是一系列的模型能力。
背后由智谱一代代的模型积累而成,所有模型均为智谱自研。
具体来看,AutoGLM沉思的技术演进路径包括:
我们在GLM-4-Air基座模型的基础上,训练出推理模型GLM-Z1-Air,基于Z1模型,结合工具使用和完成长程推理能力,训练出沉思模型,来作为AutoGLM沉思的大脑。
最后集成了智谱自研的智能体技术AutoGLM,成为AutoGLM沉思的手脚。
今天,我们将发布上述模型,以及公布开源计划。
首先介绍全新的推理模型 GLM-Z1-Air。它拥有比肩 DeepSeek R1 的推理性能,极速版的速度有 8 倍提升,而价格仅需R1的 1/30。
在性能表现上, Z1-Air 可以与DeepSeek-R1 媲美。
我们在 AIME 24/25、LCB、GPQA 等基准测试中对 GLM-Z1-Air 进行了评估,评估结果显示 GLM-Z1-Air 展现了较为强大的数理推理能力,这为更多复杂任务的解决提供了支持。
在推理速度上,极速版GLM-Z1-Air最高生成速度可达每秒 200Tokens ,是 R1 的8倍。Z1-Air能快速执行复杂任务,也为 AI 智能体的落地提供了坚实的底座。
GLM-Z1-Air 良好取得高性能与低成本间的平衡,它的价格仅为DeepSeek-R1 的1/30。
此外,GLM-Z1-Air可在消费级显卡上运行,更进一步解放开发者在硬件方面的限制。
总的来说,GLM-Z1-Air 性能可与具备更高参数的 671B 的DeepSeek-R1 相媲美,同时实现了8倍R1的推理速度,也更为便宜,仅为R1 1/30的价格。
而GLM-Z1-Air的基座模型,是我们重新训练了一个320亿参数的基模 GLM-4-Air,基于我们最新的技术积累。
在GLM-4-Air的预训练阶段,我们加入了更多的代码类、推理类数据;并在对齐阶段,针对Agent能力进行了对齐,使其更擅长工具调用、联网搜索等Agent任务。
这款模型只有 32B 的参数量,能力却比肩更大参数量的国内外主流模型。
此外,我们将更新上线 GLM-4-Flash,并推出了对应推理版本 GLM-Z1-Flash。更高速,完全免费调用,满足广泛的应用需求。
我们知道,Agent的核心就是推理规划和动手能力。
上面新发布的基座模型,就是我们AutoGLM沉思的大脑,提供推理能力,下面我们来谈谈Agent的手脚,也就是使用工具的能力——AutoGLM。
AutoGLM是我们去年10月在CNCC上发布,作为全球首个能够在手机上执行长达50多步action的大模型智能体,当时AutoGLM的出现,也意味着大模型首次跳出了Chatbot的框架,初步具备了与现实世界互动的能力。
今天所发布的AutoGLM沉思版,背后的AutoGLM能力,较上次发布在短短几个月内也有了非常大的进化。
大家都知道,大模型的预训练和后训练存在 Scaling Law。然而,不只是大模型推理满足这一规律,我们发现,Agent 也存在类似的 Scaling Law。
对于 Agent,通过扩展训练时的 inference compute,我们观察到 Agent 展现出了更强的性能。
这一 Agent Scaling Law 的背后,是我们的自进化在线课程强化学习算法框架,WebRL。我们通过设计由易到难的任务序列,逐步引导模型从简单场景向复杂场景过渡学习,从而提升训练效率和最终性能。这种方法模拟人类学习过程,通过动态调整任务难度,帮助模型积累基础能力后再挑战高难度任务,有效避免直接处理复杂问题时的训练不稳定。
在 Agent Scaling Law 的基础上,我们进一步发现了 Agent 存在的能力涌现。比如在我们的训练过程中,从未教给 AutoGLM 沉思访问过巨潮资讯网。然而,当发送指令“帮我收集昨天关于具身智能的相关研报”时,我们惊喜地发现, AutoGLM沉思能够规划出通过访问巨潮资讯解决问题的方案,并顺利操作了网站。
AutoGLM的动手能力目前在行业内处于Sota,包括浏览器、手机和电脑在内的使用工具能力,全面领先。
在斯坦福大模型中心《AI 指数 2024》选为智能体代表基准的 AgentBench 上,AutoGLM 系列模型在 5 个环境上取得超过此前所有 SOTA 表现的效果。在 Phone Use 基准 AndroidLab 和 AndroidWorld 上,AutoGLM-Phone 任务成功率相对过往 SOTA 提升超过 20%。在 Browser Use 评测基准上,AutoGLM-Web 也全面超越 OpenAI GPT-4o 和 Anthropic Claude-3.5-Sonnet。
在GUI智能体方面,CogAgent 在GUI Agent的多个榜单上取得了sota的结果。CogAgent的模型参数仅为9B,超越了包括Claude Computer Use等一众更大规模的同类模型。
我们此前预告了2025将是智谱的开源年。
上述我们提到的模型,包括基座模型GLM-4-AIR、推理模型GLM-Z1-Air、沉思模型GLM-Z1-rumination,都将在4月14日正式开源,以更好地回馈技术社区。
相关模型会在接下来的两周内,陆续上线智谱的开放平台。
智谱始终专注于AGI基座模型的研发,目前已经探索到L3-Agentic LLM阶段,我们将GLM一系列 Agent 能力,统称为Agentic GLM。未来很长一段时间内,智谱将聚焦Agentic GLM的研发。
基座模型方面,智谱将依托自主大模型技术,极致、专注地探索智能水平的上线。同时,推动从基座模型、到 Agent 基座模型、到 Agent 统一协议与平台、再到 Agent 应用与生态的等Agent相关技术的建设。
2025年将会是Agent应用的元年,智谱也将深度参与这一场浪潮,为更多应用合作伙伴,提供基座模型能力。
我们在大力发展基座模型的同时,也会积极帮助我们的生态伙伴更好地调用 Agentic GLM 能力,包括搭建MaaS平台和智能体平台,打造基于行业、地域和场景的Agent应用。
在行业生态方面,智谱坚持和行业伙伴共创,用我们在大模型研发上的积累,帮助行业伙伴成功,合力做出成功的大模型应用。
目前,我们已携手金融、教育、医疗、政务、企服等领域的合作伙伴,共同推进Agentic LLM的落地应用。
关注智谱的朋友都知道,近期,包括北京、杭州、上海、成都、珠海等在内的地方政府也官宣了和智谱的合作。
在城市生态方面,自主、安全、低幻觉的GLM大模型依然是城市首选的模型厂商。我们与当地龙头企业携手,推动地方大模型应用生态的建设。
比如在珠海,我们和珠海龙头企业华发集团联合搭建首个城市级GLM大模型空间——“智谱+珠海华发空间”,将智谱一系列语言、多模态等端侧模型部署到各个设备。类似的落地还有很多。
作为一家朝向 AGI 的公司,智谱不仅致力于推动国产大模型技术的发展,也希望能为世界贡献中国 AI 力量。
我们在积极推动中国原创大模型及解决方案出海,帮助“一带一路”国家构建自主、可控、无幻觉的国家级/区域级的自主大模型。
随着更多国家对AI的愈发重视,安全、自主、稳定可控的大模型已经成了每一个国家的刚需。
今天,有来自东盟十国及“一带一路”沿线国家的十位代表,与我们共同见证,由智谱主导发起的“自主大模型共建联盟”的成立。“自主大模型国际共建联盟”旨在帮助“一带一路”国家建立自主AI,实现人工智能技术的自主可控。这里面有一部分已经是智谱的客户,帮助其构建国家级大模型。这是真正的大模型出海,真正的民族自信。
雷递由媒体人雷建平创办,若转载请写明来源。
来源:雷递一点号