华为灵衢:用互联架构,把算力的孤岛连成大陆

B站影视 欧美电影 2025-09-24 18:26 1

摘要:当你在购物软件里刷到那件“刚好想买”的商品推荐,当各种AI大模型瞬间生成流畅而精准的答案——这些生活中越来越常见的瞬间,背后都指向同一个核心概念:算力。

当你在购物软件里刷到那件“刚好想买”的商品推荐,当各种AI大模型瞬间生成流畅而精准的答案——这些生活中越来越常见的瞬间,背后都指向同一个核心概念:算力。

这个“看不见摸不着”的神秘力量,已经成为了改变所有现代人生活的底层密码:数字时代,算力已然成为和水、电、燃气一样不可或缺的基础设施,支撑起从智能推荐到科学计算的无数场景。

但随之而来的是一个更现实的问题:当算力成为刚需,我们能否像用水用电一样,随时便捷、高效、低成本地使用它?在华为全联接大会2025上,这个问题同样也成为了整个行业关注的重点。

2025年9月18-20日,第十届华为全联接大会在上海世博展览馆及世博中心举办。本届大会以“跃升行业智能化”为主题,通过“战略全景-产业技术-生态发展”的三维视角,阐释华为全面智能化战略的最新举措,并发布全新的数智基础设施产品、行业场景化解决方案、开发工具等。

而在这次大会上,华为正在用一个崭新的构想,正式宣告着一个属于算力新纪元的开启。

“算力过去是,未来也将继续是人工智能的关键,更是中国人工智能的关键。”华为副董事长、轮值董事长徐直军在大会上提到,单一芯片再提升,也无法满足AI的算力需求,必须依赖于多芯片互联,做大规模计算节点的方式来解决。

可以说,这是进入AI大模型时代以来,留给各大科技厂商的一个重要议题。新的技术形势之下,当AI正在渗透进各行各业,传统的计算架构已经难以满足庞大的使用需求。

这个时候,很多人可能会想到“集群”——是否将服务器堆叠起来,算力就能实现大幅提升?实际上,传统集群通过“服务器堆叠和以太网联接”的模式提升算力规模。服务器之间带宽不足、时延大,集群规模越大,算力利用率反而越低。同时,集群规模扩张还带来了可靠性问题。

而解决这一切痛点的路径,都指向一个概念——超节点。

想象一下,我们并不是在讨论算力,而是在讨论城市交通。如果说节点是城市,那么架构,就是连接它们之间的道路。

普通节点就像一个小县城:车不多,路也不复杂。它想和另一个小县城连接,修一条双向两车道的公路就够了,这是很简单的事;而超节点,就像北京、上海这样的超级都市。市内就有上千万人口,不仅车流巨大,而且交通网络极其复杂。

问题来了:我们如何把“北京”和“上海”这两座超级都市,不是用普通高速公路,而是用某种“超级连接”完全融合在一起,让它们的车流、人流可以像在一个城市里一样无缝、高效地流动?

这也是超节点架构面临着的最大难题:要实现超节点架构,最难的是互联。这不仅难在构想一种全新互联模式的诞生,同时也难在模式落地之后的协调——每个超节点都像一座超级都市,有自己独特的“交通规则”。让它们直接、深度互联,无异于让北京和上海的汽车突然都混在一起跑,且不造成混乱。那么在这背后,就需要设计极其复杂的“交通规则”,且技术上非常困难。

而这一次,华为采用的是用依托一份全新协议的“集群”方式。华为基于三十多年构筑的联接技术能力,通过系统性创新,突破了大规模超节点的互联技术巨大挑战,开创了面向超节点的互联协议灵衢(UnifiedBus),并将开放灵衢2.0技术规范,使用“超节点+集群”的算力解决方案,带领行业进入算力新篇章。

事实上,灵衢的研究早已从2019年开始。它的中文名字“灵衢”,也寄托着一个美好的寓意——类似九省通衢,用超节点互联,实现大规模算力的联通。

“基于灵衢互联协议,华为开创了超节点架构,可将多台物理机器深度互联,实现逻辑层面像一台机器一样学习、思考与推理,重新定义了高效、稳定、可扩展的大规模有效算力新范式。”华为董事、ICT BG CEO杨超斌谈道。

“超节点+集群”的超节点架构具备资源池化、规模扩展、长稳可靠的关键特性,可实现计算、存储单元的大带宽和低时延互联,通过统一协议和内存编址,使有效算力能够随集群规模线性扩展,并大幅提升集群可靠性。

于是乎,当像超级城市一样的无数个超节点之间被顺利打通,一个更加高效流动且有秩序的篇章,正在缓缓展开。

可以说,当这些超节点之间的道路被打通之后,华为需要的思考便是下一个阶段:怎样基于更流通的基础上,利用好这种效率与规模。而基于灵衢和超节点架构的全新产品,华为正在带领算力行业走向一个全新的未来。

本次大会,华为推出基于灵衢和超节点架构的全新产品,包括全液冷数据中心AI超节点Atlas 950 SuperPoD、企业级风冷AI超节点服务器Atlas 850和Atlas 860、AI新一代标卡Atlas 350、业界首个通算超节点TaiShan 950 SuperPoD等。

众所周知,要为算力打好牢固的根基,首先是芯片。作为华为AI算力战略的基础,昇腾芯片将持续演进,为中国乃至世界的AI算力构筑坚固根基。

于是,在大会上,第一款宣布的产品——Atlas 950超节点,便是基于Ascend 950DT打造的。

可以说,目前放眼全球来看,Atlas 950 SuperPoD,是面向超大型AI计算任务的最佳选择,从基础器件、协议算法到光电技术,实现系统级创新突破。通过正交架构,Atlas 950实现零线缆电互联,采用液冷接头浮动盲插设计做到零漏液,其独创的材料和工艺让光模块液冷可靠性提升一倍。其创新的UB-Mesh递归直连拓扑网络架构,支持单板内、单板间和机架间的NPU全互联,以64卡为步长按需扩展,最大可实现8192卡无收敛全互联。

而Atlas 950超节点,对标的是全球TOP1的地位。“至少在未来多年都将保持是全球最强算力的超节点,并且在各项主要能力上都远超业界主要产品。” 徐直军在今年大会上的承诺,代表着华为在超节点领域,已经坐上了世界级的头把交椅。这其中包括英伟达同样将在明年下半年上市的NVL144,而即使是与英伟达计划2027年上市的 NVL576相比,Atlas 950超节点在各方面依然会保持领先。

在此之前,华为的超节点产品已经得到过市场的验证和正反馈。Atlas 900超节点已经率先做出了伟大的试验。Atlas 900超节点自今年上市以来,已经累计部署超过300套,服务20多个客户,涵盖互联网、电信、制造等多个行业。可以说,Atlas 900于2025年,开启了华为AI超节点的征程。到目前为止,Atlas 900依然是全球算力最大的超节点。

而在大会上,徐直还军宣布,未来,华为还将在2027年四季度推出Atlas 960超节点——基于Ascend 960,其总算力、内存容量、互联带宽在Atlas 950基础上再翻倍。而这也是华为对人工智能长期可持续发展所提供的一剂算力强心针。

于是,围绕着Atlas 950超节点和Atlas 960超节点,一些更有想象力的产品,也逐渐揭开神秘面纱。

首先是基于超节点发布的两个集群产品。华为同时发布了全球最强超节点集群,分别是Atlas 950 SuperCluster和 Atlas 960 SuperCluster,算力规模分别超过50万卡和达到百万卡,是当之无愧的全世界最强算力集群。

除此之外,一些更具有普惠性的产品,将会将世界最顶尖的算力资源,应用到更广大的企业级数据中心和小型工作站。

比如Atlas 850,作为业界首个企业级风冷AI超节点服务器,内部搭载8张昇腾NPU,能有效满足企业模型后训练、多场景推理等需求。而Atlas 850支持多柜灵活部署,最大可形成128台1024卡的超节点集群,是目前业内唯一可在风冷机房实现超节点架构的算力集群。

这款产品的诞生,让“超级大脑”走进寻常企业。这意味着企业不需要改造昂贵的专用液冷机房,在现有的数据中心里就能用上超节点技术,首次将超节点门槛从国家级项目拉低到企业级。

而Atlas 350标卡,采用最新的昇腾950PR芯片,向量算力提升2倍,支持更细粒度的Cacheline访问,在推荐推理场景可实现2.5倍性能提升,且单卡即可运行。Atlas 350支持4个灵衢端口互联,实现算力、内存等资源池化,让更大参数模型、更低时延应用可以在标卡上实现。

别看它是一张标准卡,但它自带灵衢接口,可连接4张标卡协同工作。这意味着即使从小规模起步,也能享受资源池化的好处,未来可以像搭乐高一样轻松扩展成更大的超节点。这是“普惠算力”的关键一步。

最后,本次发布的TaiShan 950超节点,基于Kunpeng 950打造,为全球首个通用计算超节点。这表明华为的超节点架构走向普适性——不仅服务于AI训练,也能极大提升大数据处理、科学计算等通用任务的效率,市场前景十分广阔。

当这些产品被提出之后,植根于算力基因中的“普惠性”,将会逐渐改变所有市场合作伙伴,尤其是企业级等中小型数据中心的未来。

“华为坚持硬件开放、软件开源,支持伙伴打造面向行业的超节点场景化解决方案,加速开发者高效自主创新,共建繁荣生态。”在杨超斌看来,算力作为基础资源,其价值在于下游行业的繁荣。面对DeepSeek等大模型对算力行业提出的更高要求,华为给出的一个旗帜鲜明的姿态将会是“共享与共赢”。

而这导向两个关键的路径:一个是“硬件开放”,另一个便是“软件开源”。

在硬件开放层面,华为采取了系统性的开放策略。华为坚持全面开放超节点技术,包括灵衢协议和超节点参考架构、全面开放超节点基础硬件; 首先,开放灵衢协议和超节点参考架构,允许产业界基于技术规范自研相关产品或部件。这犹如为产业界提供了一张精密的蓝图,任何企业都可以在此基础上建造符合自己需求的“算力大厦”。

其次,全面开放超节点基础硬件,包括NPU模组、风冷刀片、液冷刀片、AI标卡、CPU主板和级联卡等不同形态的硬件,方便客户和伙伴进行增量开发,设计基于灵衢的各种产品。这种开放模式使得客户和伙伴能够进行增量式创新,就像使用标准化“乐高积木”一样,灵活组合出适合不同场景的算力解决方案。

同时,华为也始终坚定认为,开源是驱动技术创新和产业进步的核心力量。

于是,操作系统灵衢组件也将全部开源,组件代码将陆续合入openEuler等多个上游操作系统开源社区。用户可以根据实际需求,将部分或全部源代码集成到现有操作系统中,自行迭代维护版本,也可以将整个组件直接合入现有操作系统,未来演进与开源社区版本同步。

此外,昇腾CANN也将全面开源开放,Mind系列组件也同步开源,并优先支持PyTorch、vLLM等业界开源社区,加速开发者自主创新。而在这之后,昇腾坚持提供开箱易用的工具软件和全流程支持,加速使能伙伴解决方案上市推广,与2500多家应用软件伙伴和基础模型伙伴,共同推动昇腾生态蓬勃发展。

以上所有举措,其实来自于华为对于算力资源的一个本质洞察——作为未来十年内最具战略性的基础资源,只有共享,才能让算力成就一个“大同”的世界。

毕竟,没有任何一家公司能够通吃所有场景。换言之,不同行业、不同场景都能有算力之后,一个更普惠的未来正在诞生:当无论是大型数据中心,还是企业级数据中心和小型工作站,都将迈向更高效的流程。

试想一下,当一个超级计算机被植入寻常的办公大楼,一切都将更有秩序:也许一家小型设计工作室,调用AI进行高清渲染时不再需要漫长排队等待;一个视频剪辑师能够借助本地化部署的AI算力,实时完成过去需要云端处理的复杂特效;一家银行的风险控制系统,可以在10毫秒内完成数以万计交易的智能分析……

华为超节点架构的推出,标志着算力基础设施竞赛已从单纯的芯片性能之争,迈入以系统架构和互联技术为核心的新阶段。这不仅是技术的迭代,更是一种产业思维的转变:将算力从分散的、异构的资源孤岛,整合为高效、弹性、可靠的算力大陆。超节点架构和开放战略,正在将算力变成真正可触可感的公共资源。

也只有当算力像水电一样流动,未来数字文明的无限可能才会被真正打开。

来源:南风窗NFC

相关推荐