摘要:9月18日——华为在AI算力芯片领域发了一个大招!在今天举办的华为全联接大会2025上,华为轮值董事长徐直军首次公布了昇腾芯片演进和目标。他表示,未来三年华为已经规划了昇腾多款芯片,包括昇腾950PR、950DT以及昇腾960、970。其中昇腾950PR 20
9月18日——华为在AI算力芯片领域发了一个大招!在今天举办的华为全联接大会2025上,华为轮值董事长徐直军首次公布了昇腾芯片演进和目标。他表示,未来三年华为已经规划了昇腾多款芯片,包括昇腾950PR、950DT以及昇腾960、970。其中昇腾950PR 2026年第一季度对外推出,该芯片采用了华为自研HBM。
根据现场公布的信息,昇腾950PR芯片架构新增支持低精度数据格式,其中FP8/MXFP8/HIF8: 1 PFLOPS,MXFP4: 2 PFLOPS,重点提升向量算力,提升互联宽带2.5倍,支持华为自研HBM高带宽内存,分为HiBL 1.0和HiZQ 2.0两个版本。规格方面,HiBL 1.0容量128GB,带宽1.6TB/s;HiZQ 2.0容量144GB,带宽4TB/s。
昇腾950和英伟达B200对比
总的来看,昇腾950PR设计重点在于提升AI推理特定阶段(如Prefill)的性能并支持多种低精度数据格式(如FP8, MXFP4)以适应AI计算需求。它采用了华为自研的HBM内存HiBL 1.0。
英伟达B200采用Blackwell架构和Chiplet设计(通过台积电4NP工艺将两个Die封装在一起),晶体管数量庞大。其192GB的HBM3e内存和8TB/s的带宽提供了强大的数据处理能力,FP4精度算力高达9 PFLOPS。B200也更适用于大规模AI训练和复杂推理。
对于万卡级别的集群,互联技术至关重要,昇腾950PR依赖于华为的超级节点(SuperPod)技术和“灵衢”互联协议,理论上可支持超50万卡的集群互联。这是在单芯片性能受限背景下,通过架构创新提升整体算力的策略。
英伟达B200采用第五代NVLink(1.8TB/s带宽)和NVSwitch技术,在单台服务器内(如DGX系统)实现GPU间的高速互联,并可通过InfiniBand网络扩展成更大集群。其互联技术久经市场检验,生态成熟。
软件与生态上,两者差距较大,昇腾950PR主要依托华为的昇思MindSpore框架及其AI生态。虽在发展初期,但在国内市场获得了一定支持,需不断完善和发展。
英伟达B200拥有极其成熟的CUDA软件生态。全球多数的AI研究人员和开发者都基于CUDA进行开发,其工具链、库(如cuDNN、NCCL)和优化模型都非常丰富,降低了开发难度并提升了效率。
英伟达B200的TDP高达1000W,对数据中心供电和散热(通常需液冷)提出了高要求。昇腾950PR的功耗数据未公开。若其采用相对成熟的制程,功耗可能低于B200,但能效比(性能/功耗)对比需实际测试。
发布/上市时间2026年第一季度(预计)2024年发布制程工艺未公开(推测受限)台积电4NP算力(峰值)FP8: 1 PFLOPSMXFP4: 2 PFLOPSFP4: 9 PFLOPS (GB200系统)内存容量128GB (HiBL 1.0)192GB HBM3e内存带宽1.6TB/s (HiBL 1.0)8TB/s互联技术华为自研超级节点 (Atlas 950, 8192卡互连)NVLink 5 (1.8TB/s), NVSwitch典型功耗未公开1000W (TDP)生态体系昇思MindSpore、AI框架CUDA、cuDNN (成熟完备的软件生态)会上,徐直军还发布了全球首个通算超节点TaiShan950 SuperPoD,计划2026年一季度上市。徐直军称,其将成为大型机、小型机终结者。此外,他还表示,算力过去是,未来也将继续是,人工智能的关键,更是中国人工智能的关键。
他表示将推出全球最强超节点Atlas 950 SuperPoD,算力规模8192卡,预计于今年四季度上市。此外新一代产品Atlas 960 SuperPoD ,算力规模15488卡,预计2027年四季度上市。
徐直军指出:“算力过去是,未来也将继续是人工智能的关键,更是中国人工智能的关键,”并再次强调:“基于中国可获得的芯片制造工艺,华为努力打造‘超节点+集群’算力解决方案,来满足持续增长的算力需求。”
徐直军认为,超节点在物理上由多台机器组成,但逻辑上以一台机器学习、思考、推理。华为发布了最新超节点产品 Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点,分别支持8192及15488张昇腾卡,在卡规模、总算力、内存容量、互联带宽等关键指标上全面领先,在未来多年都将是全球最强算力的超节点。基于超节点,华为同时发布了全球最强超节点集群,分别是Atlas 950 SuperCluster和 Atlas 960 SuperCluster,算力规模分别超过50万卡和达到百万卡,是当之无愧的全世界最强算力集群。
徐直军表示,基于全球最强算力的超节点和集群,华为对于为人工智能的长期快速发展提供可持续且充裕算力,充满信心。
同时,华为率先把超节点技术引入通用计算领域,发布全球首个通用计算超节点TaiShan 950 SuperPoD,结合GaussDB分布式数据库,能够彻底取代各种应用场景的大型机和小型机以及Exadata数据库一体机,将成为各类大型机、小型机的终结者。
华为基于三十多年构筑的联接技术能力,通过系统性创新,突破了大规模超节点的互联技术巨大挑战,开创了面向超节点的互联协议灵衢(UnifiedBus),徐直军宣布华为将开放灵衢2.0技术规范,欢迎产业界伙伴基于灵衢研发相关产品和部件,共建灵衢开放生态。
徐直军强调:“华为将以基于灵衢的超节点和集群持续满足算力快速增长的需求,推动人工智能持续发展,创造更大的价值。”(综合互联网编辑报道)
*******直播预告*****
来源:新浪财经