摘要:改了架构。它不再是一个模型干到底,是能调度多个模型的“智能体生态”,会根据任务类型和复杂度,自动切换处理方式。
昨晚到今天上午,我的消息像被按了“狂轰模式”。朋友圈、新闻推送、全在刷一个名字:GPT-5。
冷静下来,我捋了捋,这次升级,重点就三个:
一,改了架构。它不再是一个模型干到底,是能调度多个模型的“智能体生态”,会根据任务类型和复杂度,自动切换处理方式。
二,代码生成能力明显,很多人形容它是“vibe coding”,你只用自然语言描述需求,它就能吐出一个可运行的应用。
三,工具调用与自主协作能力更强。它能拆解复杂任务,甚至发现缺口时自己造工具去补齐。说实话,把光环拿掉、深度祛魅之后,就这三条。
1但比起这些功能,我更想问一句:GPT-5到底是一次范式跃迁,还是一次精心设计的技术包装。
先亮结论,智远看来,它确实有技术升级,但“范式跃迁”这个词,得慎用。因为范式跃进,除了性能提升,还意味着底层架构彻底改变。
比如:从功能机到智能机,从马车到汽车。
那这次它改了什么?架构上,GPT-5 引入了一个叫 动态路由器(Dynamic Router) 的东西。
什么意思?过去是一个万能模型干到底,现在它会先判断问题的类型、复杂度和意图,再分派给不同的专用模型去处理。
举个例子:
你问它一个简单问题(查个资料、翻译一句话),它会调主模型 GPT-5,速度快;你给它一个复杂推理(科研计算、法律推演),它会调 深度思考模型 GPT-5-thinking,推理链更长、准确率更高。
甚至如果你的额度用完了,它还会自动切到轻量版 GPT-5-mini,不中断服务。
说白了,这就是一个轻量级的 Agent 框架:你丢任务进去,它先分类,再分派,最后把结果统一交给你。
那这种多模型协同的本质是什么?
表面上,它像一支“各司其职”的团队,兼顾效率和精准度;但从技术原点看,这种思路并不新鲜。
Anthropic 早就有类似的模型切换,用不同推理深度应对不同任务;谷歌 DeepMind 的一些研究里,也出现过根据任务复杂度动态调用不同专家模型(Mixture of Experts)的方案;
开源圈的 DeepSeek MoE 架构也差不多,只是它把多模型协作藏在后台,问题复杂就多调几个专家,问题简单就少调几个,省资源。
GPT-5 巧妙的地方在于,它把这种协作做成了开箱即用的体验,而且是无感切换。用户不用再想“我该用哪个模型”,因为系统会替你选好。
这,才是 OpenAI 在商业化上的杀手锏,把原本只在研究人员、开发者手里的“多专家模式”,第一次变成了普通人也能直接用的功能。
所以我认为,技术上,它是一次架构优化+体验升级,不是底层技术革命;商业上,它是一种聪明的产品化,把技术藏起来,让协同成为默认生态。
整个发布会里,有一个最直观、最容易被感知的能力:写代码。听起来很炸,现场看起来也很热闹。那它到底是生产力革命,还是程序员的噩梦?
我更倾向于说,它是一场效率革命。
你只要用普通话、英语,甚至混合几种语言,把功能描述清楚,它就能直接生成可运行的软件。
比如说:
帮我做一个法语学习网站,要有单词卡片、语音小游戏,还有贪吃蛇改版。三分钟,它吐出 240 行代码,UI 风格都帮你配好了。
官方测试里,在 SWE-bench 这种代码基准测试中,GPT-5 的编码准确率 74.9%(GPT-4 只有 67.6%),通过率提升了 22%。
这不只是写得对,而是写得快,从按天计费,到按分钟产出,就像把一个资深全栈工程师装进了电脑里。
这样的能力,会带来三重冲击:
对中小企业老板,是大福利。开发成本直线下降,原型周期从按周迭代变成分钟级验证,创业公司可以更快测试市场,减少失败成本。
对程序员来说,初级开发岗直接面临替代;中高阶开发会转向代码审计、安全检查、性能优化,或者做「AI 协作管理」,而不是亲自写每一行代码。
对低代码平台来说,可能是生死劫。
过去还得拖拽组件、配置表单,现在在一个聊天窗口里说几句话就能搞定。「描述即应用」比「拖拽拼装」更直接、更快,这会压缩低代码平台的生存空间。
当然,这一切也不是没有成本。
官方 GPT-5 API 价格是:主模型输入每百万 token 1.25 美元,输出 10 美元;Mini 版本输入 0.25 美元、输出 2 美元;Nano 版本最便宜:输入 0.05 美元、输出 0.40 美元。
价格表看着简单,但实际用起来没那么直白。
Reasoning(推理)能力越强,模型在后台「思考」消耗的隐形 token 就越多,你甚至看不到这些 token,账单却能蹭蹭往上涨。
而且,国内早就有类似的「说话写代码」工具,也不差:
百度的「文心快码(Baidu Comate)」、腾讯云 CloudBase 在 6 月发布的 AI Builder、字节的 TRAE……
区别只是,他们把写代码单独做成一个产品,而 GPT-5 把这种能力直接塞进了 AI 「大脑」里,一个 Chat 窗口几乎能包揽开发、接口、逻辑、UI,体验还统一。
所以,有三个问题必须问:
一,API 价格虽清楚,但让 AI 「仔细思考」的成本可能远超预期,越用越上瘾,会不会让企业不断加钱?
二,国内这些工具未来会不会也学 GPT-5,把所有能力打包成「什么都能做的一个 Agent」?三,代码生成快,但真够安全、可维护吗?
毕竟真实业务场景里,谁也不可能天天在开发大型 App,大多数时候是临时搓个统计表、搭个审批流,或者做个协同工具,这才是低代码平台的日常战场。
3写代码是冰山一角,如果把能力打包到一个智能体生态里,行业格局就不一样了。
为什么?
因为在商业竞争里,单点能力只能解决局部问题;而平台化能力,意味着你能在一个入口下,解决一整条业务链的问题。
举个简单的对比:
单点 AI 工具,就像你请了个外包写手,用完就走;智能体生态,更像你签了一个全能秘书,能查资料、能写、能排版,甚至能直接帮你发出去。
企业需求永远是闭环,谁能提供闭环,谁就占据优势。
从数据角度出发,公版 GPT-5 很强,但如果把企业自己的历史业务数据、流程数据、客户数据都喂给它,生成的智能体会立刻变成「懂行的内行人」。
这种效果,中小企业在公版模型里几乎复刻不了。
从算力壁垒上来说,多模型调度 + 长推理,对算力消耗很大。巨头企业有能力自建机房、签长期算力合约,这才是真正赚钱的地方。
从用户触点来看,有现成入口的公司,更容易把智能体生态捆绑到现有产品里。
比如:
微软有 Office、Teams、Outlook,天然覆盖全球数亿知识工作者;谷歌有 Workspace、Gmail、Drive,可以在用户的日常工作流中无缝嵌入 AI;Salesforce 有 CRM 和一整套企业应用,可以直接让智能体深入销售、客服、运营环节。
这意味着,它可以直接在自己的应用里嵌入 AI 平台,形成天然分发渠道。
换句话说,如果你用一个集合多个模型的 Agent,把它放进业务系统里,它就成了一个「超级 Agent」。
这种趋势下,低代码平台如果不做平台化转型,会被「描述即应用」直接碾压;传统 SaaS 只解决流程里的一个环节,可能会被一整套智能体生态直接打包替代。
一些中小 AI 创业公司,如果核心价值只是「在 GPT 上做个小工具」,那很可能只是在帮巨头做功能验证。
在我看来,这才是 Sam Altman 的真正算盘。
因为企业要的不是“用 AI”,而是“用 AI 完成业务”。如果有一家公司能在一个入口、一套账单、一个平台里加一个AI搞定所有环节,它不仅会抢走别人的功能,还会截留客户关系和数据。
因此,我才说,真正的变化在水面之下,平台化协同,有可能把 ToB 行业的格局重新洗一遍。
4平台化协同,听起来是颠覆性机会,但要真落地,风险也不小,尤其是 GPT-5 想做 To B(面向企业市场),它有三座大山要翻过去。
发布会上的案例,几乎“满分条件”,数据干净且统一格式、流程设计清晰,没有跨部门博弈、系统接口提前打通。
可真实的企业环境,完全不是这样。
Salesforce 在推 Einstein AI 时,就公开提醒过:如果数据是脏的,再强的 AI 也会给出错误甚至误导性的结果。
落到现实里,智能体协作要面对五花八门的 ERP 系统、年代久远的数据库、不标准的 API,甚至是人为设置的流程壁垒。
换句话说,智远认为,GPT-5 在发布会上的“秒级响应”,进了企业,很可能变成十几分钟跑一遍,体验差别不是一点点。
另外,智能体生态好处是闭环,但坏处是闭环的脆弱性。
GPT-多模型调度、长推理链条意味着更多潜在的故障点,这些在工业生产、金融交易,医疗诊断场景中,一次错误,可能引发不少损失,而且你很可能第一时间都发现不了是 AI 搞的鬼。
有研究披露,2024 年,有研究披露,微软在 Teams 与 Copilot 深度整合时,曾出现权限 Bug:一个部门的 AI 助手误读了另一个部门的敏感文件;还有 Recall 自动工具,被发现截图时顺带捕捉了密码、银行卡等信息。
值得一提的是,要让智能体真正帮企业跑业务,就必然要跨系统、跨部门传递数据。
这里面有两个棘手问题:
一,责任归属,如果 AI 给出了错误决策,导致财务损失或合规事故,责任是在 AI 提供商、企业 IT 部门,还是模型本身?
二数据安全,不管是美国还是欧盟,对数据有严格限制,踩线就可能面临巨额罚款。
那如果这三道坎都跨过去了,问题又来了:越来越多的智能体帮人做事,那人还能做什么?我认为人类至少还有三种能力,是现在越来越稀缺的:
一,提出战略级问题的能力,战略级问题是没有标准答案,需要权衡取舍、看清大势的问题。
比如:这个季度压利润换规模,还是保利润牺牲增长?要不要为了抢先布局,冒一次政策风险?这些问题不仅涉及数据,还涉及价值观、文化、甚至政治判断。
AI 可以给你列出各种选项的利弊,但决定走哪条路,只能由人来拍板。
二,设计规则与价值交换的能力。在一个智能体生态里,不同系统、不同部门、甚至不同公司之间要不断交换数据和成果。
那数据怎么流转、谁能用、谁付费、谁分红,就得有人先设计好规则;比如:制造智能体在不同供应商之间调配产能,优先级谁定?利益怎么平衡?
其三,就是反共识。
GPT-5 的知识,来自于既有信息和模式识别,它会综合主流观点,得出一个“平均最优解”。可真正颠覆性的创新,往往不是平均值,是反常数。
iPhone 刚出来时,大多数人觉得全触屏很荒唐,特斯拉刚造车时,整个汽车行业都不看好电动车;人类的创造力,往往来自跨界、偶然的火花,来自对主流逻辑的怀疑和推翻。
所以,在我看来,GPT-5 再强,也只把执行力推到了一个新高度,人类的优势,正在从“会做事”转向“会定事、会定规则、会逆流而行”。
不管怎么说,GPT-5的出现,我没觉得它强到碾压一切,反而更像是在抄中国的作业,尤其是 Agent 这一块。
Sam Altman,真是太会「拿来主义」了。
来源:王智远一点号