华为灵衢：用互联架构，把算力的孤岛连成大陆

摘要：当你在购物软件里刷到那件“刚好想买”的商品推荐，当各种AI大模型瞬间生成流畅而精准的答案——这些生活中越来越常见的瞬间，背后都指向同一个核心概念：算力。

当你在购物软件里刷到那件“刚好想买”的商品推荐，当各种AI大模型瞬间生成流畅而精准的答案——这些生活中越来越常见的瞬间，背后都指向同一个核心概念：算力。

这个“看不见摸不着”的神秘力量，已经成为了改变所有现代人生活的底层密码：数字时代，算力已然成为和水、电、燃气一样不可或缺的基础设施，支撑起从智能推荐到科学计算的无数场景。

但随之而来的是一个更现实的问题：当算力成为刚需，我们能否像用水用电一样，随时便捷、高效、低成本地使用它？在华为全联接大会2025上，这个问题同样也成为了整个行业关注的重点。

2025年9月18-20日，第十届华为全联接大会在上海世博展览馆及世博中心举办。本届大会以“跃升行业智能化”为主题，通过“战略全景-产业技术-生态发展”的三维视角，阐释华为全面智能化战略的最新举措，并发布全新的数智基础设施产品、行业场景化解决方案、开发工具等。

而在这次大会上，华为正在用一个崭新的构想，正式宣告着一个属于算力新纪元的开启。

“算力过去是，未来也将继续是人工智能的关键，更是中国人工智能的关键。”华为副董事长、轮值董事长徐直军在大会上提到，单一芯片再提升，也无法满足AI的算力需求，必须依赖于多芯片互联，做大规模计算节点的方式来解决。

可以说，这是进入AI大模型时代以来，留给各大科技厂商的一个重要议题。新的技术形势之下，当AI正在渗透进各行各业，传统的计算架构已经难以满足庞大的使用需求。

这个时候，很多人可能会想到“集群”——是否将服务器堆叠起来，算力就能实现大幅提升？实际上，传统集群通过“服务器堆叠和以太网联接”的模式提升算力规模。服务器之间带宽不足、时延大，集群规模越大，算力利用率反而越低。同时，集群规模扩张还带来了可靠性问题。

而解决这一切痛点的路径，都指向一个概念——超节点。

想象一下，我们并不是在讨论算力，而是在讨论城市交通。如果说节点是城市，那么架构，就是连接它们之间的道路。

普通节点就像一个小县城：车不多，路也不复杂。它想和另一个小县城连接，修一条双向两车道的公路就够了，这是很简单的事；而超节点，就像北京、上海这样的超级都市。市内就有上千万人口，不仅车流巨大，而且交通网络极其复杂。

问题来了：我们如何把“北京”和“上海”这两座超级都市，不是用普通高速公路，而是用某种“超级连接”完全融合在一起，让它们的车流、人流可以像在一个城市里一样无缝、高效地流动？

这也是超节点架构面临着的最大难题：要实现超节点架构，最难的是互联。这不仅难在构想一种全新互联模式的诞生，同时也难在模式落地之后的协调——每个超节点都像一座超级都市，有自己独特的“交通规则”。让它们直接、深度互联，无异于让北京和上海的汽车突然都混在一起跑，且不造成混乱。那么在这背后，就需要设计极其复杂的“交通规则”，且技术上非常困难。

而这一次，华为采用的是用依托一份全新协议的“集群”方式。华为基于三十多年构筑的联接技术能力，通过系统性创新，突破了大规模超节点的互联技术巨大挑战，开创了面向超节点的互联协议灵衢（UnifiedBus），并将开放灵衢2.0技术规范，使用“超节点+集群”的算力解决方案，带领行业进入算力新篇章。

事实上，灵衢的研究早已从2019年开始。它的中文名字“灵衢”，也寄托着一个美好的寓意——类似九省通衢，用超节点互联，实现大规模算力的联通。

“基于灵衢互联协议，华为开创了超节点架构，可将多台物理机器深度互联，实现逻辑层面像一台机器一样学习、思考与推理，重新定义了高效、稳定、可扩展的大规模有效算力新范式。”华为董事、ICT BG CEO杨超斌谈道。

“超节点+集群”的超节点架构具备资源池化、规模扩展、长稳可靠的关键特性，可实现计算、存储单元的大带宽和低时延互联，通过统一协议和内存编址，使有效算力能够随集群规模线性扩展，并大幅提升集群可靠性。

于是乎，当像超级城市一样的无数个超节点之间被顺利打通，一个更加高效流动且有秩序的篇章，正在缓缓展开。

可以说，当这些超节点之间的道路被打通之后，华为需要的思考便是下一个阶段：怎样基于更流通的基础上，利用好这种效率与规模。而基于灵衢和超节点架构的全新产品，华为正在带领算力行业走向一个全新的未来。

本次大会，华为推出基于灵衢和超节点架构的全新产品，包括全液冷数据中心AI超节点Atlas 950 SuperPoD、企业级风冷AI超节点服务器Atlas 850和Atlas 860、AI新一代标卡Atlas 350、业界首个通算超节点TaiShan 950 SuperPoD等。

众所周知，要为算力打好牢固的根基，首先是芯片。作为华为AI算力战略的基础，昇腾芯片将持续演进，为中国乃至世界的AI算力构筑坚固根基。

于是，在大会上，第一款宣布的产品——Atlas 950超节点，便是基于Ascend 950DT打造的。

可以说，目前放眼全球来看，Atlas 950 SuperPoD，是面向超大型AI计算任务的最佳选择，从基础器件、协议算法到光电技术，实现系统级创新突破。通过正交架构，Atlas 950实现零线缆电互联，采用液冷接头浮动盲插设计做到零漏液，其独创的材料和工艺让光模块液冷可靠性提升一倍。其创新的UB-Mesh递归直连拓扑网络架构，支持单板内、单板间和机架间的NPU全互联，以64卡为步长按需扩展，最大可实现8192卡无收敛全互联。

而Atlas 950超节点，对标的是全球TOP1的地位。“至少在未来多年都将保持是全球最强算力的超节点，并且在各项主要能力上都远超业界主要产品。” 徐直军在今年大会上的承诺，代表着华为在超节点领域，已经坐上了世界级的头把交椅。这其中包括英伟达同样将在明年下半年上市的NVL144，而即使是与英伟达计划2027年上市的 NVL576相比，Atlas 950超节点在各方面依然会保持领先。

在此之前，华为的超节点产品已经得到过市场的验证和正反馈。Atlas 900超节点已经率先做出了伟大的试验。Atlas 900超节点自今年上市以来，已经累计部署超过300套，服务20多个客户，涵盖互联网、电信、制造等多个行业。可以说，Atlas 900于2025年，开启了华为AI超节点的征程。到目前为止，Atlas 900依然是全球算力最大的超节点。

而在大会上，徐直还军宣布，未来，华为还将在2027年四季度推出Atlas 960超节点——基于Ascend 960，其总算力、内存容量、互联带宽在Atlas 950基础上再翻倍。而这也是华为对人工智能长期可持续发展所提供的一剂算力强心针。

于是，围绕着Atlas 950超节点和Atlas 960超节点，一些更有想象力的产品，也逐渐揭开神秘面纱。

首先是基于超节点发布的两个集群产品。华为同时发布了全球最强超节点集群，分别是Atlas 950 SuperCluster和 Atlas 960 SuperCluster，算力规模分别超过50万卡和达到百万卡，是当之无愧的全世界最强算力集群。

除此之外，一些更具有普惠性的产品，将会将世界最顶尖的算力资源，应用到更广大的企业级数据中心和小型工作站。

比如Atlas 850，作为业界首个企业级风冷AI超节点服务器，内部搭载8张昇腾NPU，能有效满足企业模型后训练、多场景推理等需求。而Atlas 850支持多柜灵活部署，最大可形成128台1024卡的超节点集群，是目前业内唯一可在风冷机房实现超节点架构的算力集群。

这款产品的诞生，让“超级大脑”走进寻常企业。这意味着企业不需要改造昂贵的专用液冷机房，在现有的数据中心里就能用上超节点技术，首次将超节点门槛从国家级项目拉低到企业级。

而Atlas 350标卡，采用最新的昇腾950PR芯片，向量算力提升2倍，支持更细粒度的Cacheline访问，在推荐推理场景可实现2.5倍性能提升，且单卡即可运行。Atlas 350支持4个灵衢端口互联，实现算力、内存等资源池化，让更大参数模型、更低时延应用可以在标卡上实现。

别看它是一张标准卡，但它自带灵衢接口，可连接4张标卡协同工作。这意味着即使从小规模起步，也能享受资源池化的好处，未来可以像搭乐高一样轻松扩展成更大的超节点。这是“普惠算力”的关键一步。

最后，本次发布的TaiShan 950超节点，基于Kunpeng 950打造，为全球首个通用计算超节点。这表明华为的超节点架构走向普适性——不仅服务于AI训练，也能极大提升大数据处理、科学计算等通用任务的效率，市场前景十分广阔。

当这些产品被提出之后，植根于算力基因中的“普惠性”，将会逐渐改变所有市场合作伙伴，尤其是企业级等中小型数据中心的未来。

“华为坚持硬件开放、软件开源，支持伙伴打造面向行业的超节点场景化解决方案，加速开发者高效自主创新，共建繁荣生态。”在杨超斌看来，算力作为基础资源，其价值在于下游行业的繁荣。面对DeepSeek等大模型对算力行业提出的更高要求，华为给出的一个旗帜鲜明的姿态将会是“共享与共赢”。

而这导向两个关键的路径：一个是“硬件开放”，另一个便是“软件开源”。

在硬件开放层面，华为采取了系统性的开放策略。华为坚持全面开放超节点技术，包括灵衢协议和超节点参考架构、全面开放超节点基础硬件；首先，开放灵衢协议和超节点参考架构，允许产业界基于技术规范自研相关产品或部件。这犹如为产业界提供了一张精密的蓝图，任何企业都可以在此基础上建造符合自己需求的“算力大厦”。

其次，全面开放超节点基础硬件，包括NPU模组、风冷刀片、液冷刀片、AI标卡、CPU主板和级联卡等不同形态的硬件，方便客户和伙伴进行增量开发，设计基于灵衢的各种产品。这种开放模式使得客户和伙伴能够进行增量式创新，就像使用标准化“乐高积木”一样，灵活组合出适合不同场景的算力解决方案。

同时，华为也始终坚定认为，开源是驱动技术创新和产业进步的核心力量。

于是，操作系统灵衢组件也将全部开源，组件代码将陆续合入openEuler等多个上游操作系统开源社区。用户可以根据实际需求，将部分或全部源代码集成到现有操作系统中，自行迭代维护版本，也可以将整个组件直接合入现有操作系统，未来演进与开源社区版本同步。

此外，昇腾CANN也将全面开源开放，Mind系列组件也同步开源，并优先支持PyTorch、vLLM等业界开源社区，加速开发者自主创新。而在这之后，昇腾坚持提供开箱易用的工具软件和全流程支持，加速使能伙伴解决方案上市推广，与2500多家应用软件伙伴和基础模型伙伴，共同推动昇腾生态蓬勃发展。

以上所有举措，其实来自于华为对于算力资源的一个本质洞察——作为未来十年内最具战略性的基础资源，只有共享，才能让算力成就一个“大同”的世界。

毕竟，没有任何一家公司能够通吃所有场景。换言之，不同行业、不同场景都能有算力之后，一个更普惠的未来正在诞生：当无论是大型数据中心，还是企业级数据中心和小型工作站，都将迈向更高效的流程。

试想一下，当一个超级计算机被植入寻常的办公大楼，一切都将更有秩序：也许一家小型设计工作室，调用AI进行高清渲染时不再需要漫长排队等待；一个视频剪辑师能够借助本地化部署的AI算力，实时完成过去需要云端处理的复杂特效；一家银行的风险控制系统，可以在10毫秒内完成数以万计交易的智能分析……

华为超节点架构的推出，标志着算力基础设施竞赛已从单纯的芯片性能之争，迈入以系统架构和互联技术为核心的新阶段。这不仅是技术的迭代，更是一种产业思维的转变：将算力从分散的、异构的资源孤岛，整合为高效、弹性、可靠的算力大陆。超节点架构和开放战略，正在将算力变成真正可触可感的公共资源。

也只有当算力像水电一样流动，未来数字文明的无限可能才会被真正打开。

来源：南风窗NFC

标签：华为开源架构集群 atlas

本文地址：http://news.43b.com.cn/a/1326697.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!

相关推荐