摘要:在不久前举行的华为全联接大会2025上,华为副董事长、轮值董事长徐直军揭开了全新算力解决方案的面纱,超节点与集群。
在不久前举行的华为全联接大会2025上,华为副董事长、轮值董事长徐直军揭开了全新算力解决方案的面纱,超节点与集群。
他没有透露芯片制程工艺的细节,而是兴奋地展示着华为基于国内能获得的芯片制造技术,打造出的“超节点+集群”算力解决方案。
这一方案旨在满足当前AI越来越大的算力需求,毕竟无论是AI训练还是数据处理,没有足够的算力根本跑不动。
在算力领域,我们常常面临一个难题,就是单个芯片的性能有限,而简单把多个芯片堆在一起,效率又会大打折扣。
因此,华为提出的超节点架构完美解决了这一痛点。
徐直军这样解释:“超节点在物理上由多台机器组成,但逻辑上以一台机器学习、思考、推理。”
说白了,超节点就像一支训练有素的合唱团,虽然由许多人组成,但唱出来的是一个和谐统一的声音,而不是各唱各调的杂乱声音。
传统服务器堆叠的模式带来的是集群规模越大,算力利用率越低。
而超节点架构通过资源池化、规模扩展、长稳可靠的关键特性,使有效算力能够随集群规模线性扩展。
华为此次发布的超节点产品实力不容小觑,Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点分别支持8192张和15488张昇腾卡。
这两个数字背后代表着在卡规模、总算力、内存容量、互联带宽等关键指标上的全面领先。
华为宣称,这些超节点在未来多年都将是全球最强算力的超节点,有了超节点,华为还搭建了更大的“算力军团”,也就是超节点集群。
据介绍,Atlas 950 SuperCluster和Atlas 960 SuperCluster的算力规模分别超过50万卡和达到百万卡级别,堪称全球最强的算力集群。
但华为并未止步于AI算力,更是将超节点技术引入通用计算领域,发布的TaiShan 950 SuperPoD成为全球首个通用计算超节点。
这一产品与华为云GaussDB分布式数据库结合,能够彻底取代各种应用场景的大型机、小型机以及Exadata数据库一体机。
在数据库场景,以灵衢互联为基础形成的内存池化能力和超低时延,大幅提升事务处理性能,实现数据库tpmC性能1.9倍提升。
在虚机热迁移场景,通过Full mesh全互联的架构实现超大带宽,将迁移时间从100毫秒降到50毫秒,使业务无感知。
在大数据场景,通过内存借用和池化能力,资源利用率从50%提升到70%。
能实现如此强大的超节点和集群,背后离不开华为的一项秘密武器,也就是灵衢互联技术。
华为基于三十多年积累的联接技术能力,通过系统性创新,突破了大规模超节点互联技术的重大挑战。
灵衢互联技术是华为开创的面向超节点的互联协议,它通过统一协议和内存编址,实现计算、存储单元的大带宽和低时延互联。
在华为全联接大会2025上,徐直军宣布开放灵衢2.0技术规范,欢迎产业界伙伴基于该规范研发相关产品与部件,共同构建灵衢开放生态。
这一举措,将更广泛地促进互联技术发展和产业进步。
徐直军强调:“算力过去是、未来也将继续是人工智能的关键,更是中国人工智能发展的关键。”这一判断与行业数据不谋而合。
根据2025年发布的《智算产业发展研究报告》,2025年我国智能算力规模预计增长43%,远高于通用算力的增幅。
在AI技术快速迭代的今天,算力已成为国家和企业竞争的关键领域。
欧美国家正抢占主导地位,美国启动“星际之门”计划,欧盟推出“InvestAI”计划,都在强化AI基础设施与供应链主权。
华为的超节点与集群解决方案,正是应对这一国际竞争的重要举措。
徐直军表示,基于全球最强算力的超节点和集群,华为对于为人工智能的长期快速发展提供可持续且充裕算力,充满信心。
在芯片工艺存在限制的情况下,华为没有选择死磕单一芯片性能,而是通过系统级创新,将多个芯片高效组合起来,形成了更强大的算力。
超节点架构背后,是华为三十多年技术积累的集中体现,华为的灵衢互联技术则让成千上万的芯片协同工作,二者的结合,将成为中国AI发展的坚实底座!
来源:王石头