华为阿里同时押注超节点!AI换赛道 这5大板块要先看明白

B站影视 内地电影 2025-10-05 07:32 1

摘要:上周刷华为全连接大会直播,看到个特别提气的画面:华为云负责人直接亮出CloudMatrix 384超节点的订单数据——已经卖了300多套,服务了20多家政企客户,连国家气象局都用它做台风路径AI预测。转头第二天阿里云栖大会,又看到阿里云官宣磐久128超节点服务

上周刷华为全连接大会直播,看到个特别提气的画面:华为云负责人直接亮出CloudMatrix 384超节点的订单数据——已经卖了300多套,服务了20多家政企客户,连国家气象局都用它做台风路径AI预测。转头第二天阿里云栖大会,又看到阿里云官宣磐久128超节点服务器量产,说推理性能比传统架构提升50%,还签了5家新能源车企做智能驾驶算力支持。

这两大巨头前后脚砸钱押注,明显不是巧合。以前聊AI竞争,大家都在说“谁的芯片算力强”“谁的大模型参数多”,但现在风向变了——单芯片性能再强,散着用也拼不过“抱团发力”的超节点。这就像以前打仗拼单个士兵的装备,现在拼的是军团协同作战能力。而超节点就是AI时代的“算力军团”,它一火,背后5个核心板块直接站在了风口上。今天就把超节点的逻辑拆透,从“是什么”到“带火谁”,全讲成大白话,看懂这波趋势才不会踏错节奏。

先得把最基础的讲清楚:超节点到底是啥?为啥华为阿里都要抢着做?

说白了,超节点就是把几百上千个AI计算芯片,用高速互联技术“捆成一个整体”,变成一个“超级算力单元”。举个例子,以前做AI训练,就像几十个人用对讲机开会,你说一句我得等半天,数据在服务器之间传得慢还容易出错;但超节点不一样,它用高速网络把所有芯片连得像“神经末梢”一样,数据传递又快又同步,相当于几十个人面对面实时沟通,效率直接翻几倍。

就拿华为的CloudMatrix 384超节点来说,它能把432个超节点级联成16万卡的超大集群,应付十万亿参数的大模型训练都不费劲;阿里云的磐久128超节点更实在,单柜就能装128个AI计算芯片,给车企做智能驾驶推理时,响应速度比传统架构快30%。以前咱们做AI得依赖英伟达的DGX超节点,现在华为阿里的产品不仅性能追上来,价格还比国外的便宜25%,连国内头部AI公司都开始换国产超节点了——这不是简单的“替代”,是AI竞争从“单芯片比拼”转向“系统架构比拼”的信号。

搞懂了超节点是啥,就知道它带火的5大板块不是凭空涨,每一个都踩在“刚需”上,咱们按“产业链从上游到下游”一个个说透:

第一个是“高速互联芯片”——超节点的“神经线”,没有它芯片就没法抱团。

超节点里几百个芯片要实时传数据,全靠高速互联芯片搭桥。以前这市场被美国博通、迈络思垄断,一块芯片卖800美元,还得绑定它们的网络设备。但现在国内企业已经追上来了,比如一家做高速芯片的公司,推出的112G SerDes芯片,能支持超节点里芯片间每秒112G的数据传输,性能和博通的持平,价格却只要500美元。华为的CloudMatrix超节点里,就用了这家的互联芯片,占比还不低。2025年上半年,国内高速互联芯片的国产替代率已经从去年的15%涨到28%,随着超节点放量,这板块还得往上走——毕竟每一套超节点,都得配几十颗互联芯片,需求根本不愁。

第二个是“AI服务器整机”——超节点的“骨架”,芯片得装在里面才能用。

超节点不是芯片堆在一起就行,得有专门的服务器整机来装,还得解决散热、供电这些问题。以前国内AI服务器大多靠代工,现在华为、浪潮这些企业直接做“超节点定制服务器”。比如华为的Atlas 900 PoD超节点服务器,单台就能装32个昇腾910B芯片,还自带液冷散热,比传统风冷的散热效率高40%,刚好适配超节点的高密度需求。2025年上半年,国内超节点服务器出货量同比涨了180%,其中华为和浪潮占了65%的市场份额。更关键的是,这种定制服务器的毛利率比普通AI服务器高15%,企业做这生意更赚钱——既能卖硬件,还能赚后期运维的钱,属于“两头受益”。

第三个是“液冷散热”——超节点的“空调”,芯片抱团发热必须靠它。

几百个芯片挤在一个超节点里,发热量是普通服务器的3倍,传统的风扇散热根本扛不住,液冷散热就成了刚需。以前液冷技术大多用在数据中心,现在超节点直接把液冷做成“标配”。比如阿里云的磐久超节点服务器,用的是“冷板式液冷”,把冷却板直接贴在芯片上,散热效率比风冷高60%,还能省30%的电费。国内做液冷的企业也跟着受益,有家公司专门给华为超节点做液冷模组,2025年上半年营收同比涨了120%,订单都排到明年一季度了。现在超节点的液冷渗透率已经从去年的20%涨到50%,未来只要做超节点,就必须配液冷,这板块的需求只会越来越稳。

第四个是“算力调度软件”——超节点的“指挥官”,得让芯片分工干活。

超节点里几百个芯片要是乱干活,效率反而会低,这就需要算力调度软件来“指挥”:哪部分芯片做训练,哪部分做推理,数据怎么分配,全靠软件来安排。以前这软件被英伟达的CUDA生态垄断,国内企业只能跟着用,但现在华为推出了MindSpore-mesh调度软件,能直接管理超节点里的所有芯片,还支持多厂商芯片混合调度——比如把昇腾芯片和寒武纪芯片放在一个超节点里,软件照样能分配任务。阿里云也推出了“飞天算力调度平台”,给超节点做智能负载均衡,让算力利用率提高25%。2025年上半年,国内超节点调度软件的市场规模已经突破20亿,随着超节点普及,这软件还得“按套卖”,每套价格从50万到200万不等,利润空间比硬件还大。

第五个是“行业应用落地”——超节点的“战场”,最终得靠应用赚钱。

超节点不是“摆着看”的,得用到具体行业里才值钱。现在华为阿里的超节点已经落地了不少场景:国家气象局用华为超节点做台风路径预测,把预测精度提高15%;比亚迪用阿里云超节点做智能驾驶训练,把训练周期从30天缩短到18天;甚至连医院都在用超节点做AI病理分析,阅片速度比医生快10倍。这些行业应用一旦跑通,超节点的需求就会“批量来”——比如新能源车企,每款新车型的智能驾驶都得靠超节点训练,一家车企一年至少得买3-5套超节点;政务领域更不用说,智慧城市、应急管理都需要超节点做算力支撑。2025年上半年,超节点在行业应用的营收占比已经从去年的30%涨到45%,未来这部分还会是增长主力。

把这5大板块捋完,其实能发现一个很关键的规律:超节点带火的不是“概念”,是“实打实的产业链需求”。以前炒AI,很多人盯着“谁的大模型参数多”,但参数再多,没有超节点这种算力架构支撑,也没法落地;现在超节点直接打通了“算力生产-算力调度-算力应用”的全链条,每一个板块都有“产品卖、有订单、有利润”,这种趋势才是真的“可持续”。

可能有人会问:超节点会不会像以前的“元宇宙”一样,炒一阵就凉了?其实不会,因为它解决了“真痛点”。以前做AI训练,企业得花几亿建数据中心,还得等半年才能凑够算力;现在买一套超节点,几周就能搭起算力集群,成本还降了30%。就像华为云负责人说的:“超节点不是选答题,是AI大模型落地的必答题。”现在国内已经有80多家AI企业订了超节点,连国外的三星都来咨询华为的超节点产品,这说明它不是“国内自嗨”,是真的有全球竞争力。

还有个很有意思的点:这5大板块里,既有硬件(互联芯片、服务器、液冷),也有软件(调度软件),还有应用(行业落地),不管是做硬件的还是做软件的,都能吃到超节点的红利。不像以前炒AI,只火芯片一个板块,其他板块都跟着陪跑。这种“全产业链受益”的趋势,才更健康,也更有持续性。

你平时有没有留意过身边的“AI算力”应用?比如导航里的实时路况预测、医院的AI体检报告。这5大板块里,你觉得高速互联芯片和液冷散热,哪一个更先放量?或者你更看好超节点在智能驾驶还是政务领域的应用?不妨在评论区聊一聊,看看大家的想法是不是一样。

我是季秋,我每天会分享有用的知识,感谢大家的喜欢,咱们明天见!!

来源:季秋

相关推荐