昇腾算力3年规划大增100%,性能指标翻倍直追英伟达!

B站影视 韩国电影 2025-09-18 17:35 1

摘要:昨天跟大家重点说的国运题材,今天再度迎来爆发,而今天离不开华为昇腾新品规划的强势推动!2026-2028 年昇腾芯片将实现从 950 系列到 970 的阶梯式突破。昇腾的迭代路线不仅是一份产品规划表,更是华为在AI算力时代的战略宣言。未来几年,中国AI生态将迎

昨天跟大家重点说的国运题材,今天再度迎来爆发,而今天离不开华为昇腾新品规划的强势推动!2026-2028 年昇腾芯片将实现从 950 系列到 970 的阶梯式突破。昇腾的迭代路线不仅是一份产品规划表,更是华为在AI算力时代的战略宣言。未来几年,中国AI生态将迎来新的跃升,相关产业链公司价值量将大幅提升,充分受益!

一、昇腾芯片路线图:算力翻倍式突破!

在 9 月 18 日的华为全联接大会 2025 上,轮值董事长徐直军重磅发布了昇腾 AI 芯片未来三年的技术演进路线图,明确了昇腾 950PR、950DT、960、970四大核心产品的上市节点与技术突破方向,展现了华为在国产算力领域 “自主可控、持续领先” 的战略决心。

昇腾(Ascend)芯片蓝图:

2025年Q1:910C

2026年Q1:950PR=950 Die + HIBL 1.0

2026年Q4:950DT=950 Die +HIZQ 2.0

2026年Q4:960

2028年Q4:970

1. 昇腾 950 系列:升级优势

昇腾 950PR(2026Q1 推出):面向推理 Prefill 阶段与推荐场景,首次集成华为自研 HBM(HiBL 1.0),内存容量达 144GB,带宽提升至 4TB/s,互联带宽相比前代昇腾 910C 跃升至 2TB/s。其 FP8 算力达 1P、FP4 算力达 2P,新增支持 MXFP8、MXFP4 等低精度格式,可大幅降低 AI 推理时延与能耗。

昇腾 950DT(2026Q4 推出):聚焦推理 Decode 阶段与训练场景,采用 HiZQ 2.0 自研 HBM,内存容量维持 144GB 但带宽优化至更高水平,同时支持 FP8/FP4 混合精度计算,为大模型训练提供更强支撑。

910C vs 950PR的变化升级:

(1)算力:800T FP16 vs 1P FP8/2P FP4,新增FP8、FP4算力类型;

(2)HBM:128GB,3.2TB/s vs 144GB,4TB/s;

(3)互联带宽:784 GB/s vs 2TB/s。

2. 昇腾 960 与 970:全球最强算力标杆

昇腾 960(2027Q4 推出):算力、内存容量、互联端口数全面翻倍,FP4 算力达 4P,支持自研 HiF4 数据格式,全光互联带宽突破 4PB/s,目标替代英伟达 H100 级产品。

昇腾 970(2028Q4 推出):各项指标再次翻倍,FP4 算力达 8P、FP8 算力达 16P,互联带宽提升至 8PB/s,内存访问带宽增加 1.5 倍,目标成为全球首个支持 EB 级内存池化的 AI 芯片。

技术迭代逻辑:昇腾芯片以 “几乎一年一代、算力翻倍” 的节奏演进,核心围绕低精度计算优化、自研存储技术突破、全光互联架构升级三大主线,逐步构建从边缘到云端的全场景算力矩阵。

二、昇腾超节点技术大幅升级

面对大模型训练对算力密度与互联效率的极致需求,华为正式将超节点技术推向规模化应用阶段,发布Atlas 950/960 SuperPoD与全球首个通用计算超节点 TaiShan950 SuperPoD,构建 “算力集群 + 通用算力” 双轮驱动的基础设施体系。

1. 全球最强 AI 超节点:Atlas 系列

Atlas 950 SuperPoD(2026Q4 上市):支持 8192 张昇腾卡,FP8 算力达 8 EFLOPS,全光互联带宽 16.3PB/s,跨柜卡间时延<2.1 微秒,可支撑千亿参数大模型的实时训练与推理。

Atlas 960 SuperPoD(2027Q4 上市):算力规模扩大至 15488 卡,FP8 算力达 30 EFLOPS,采用华为自研 UB-Mesh 互联协议,实现集群级 “逻辑单机” 协同,目标成为全球首个支持百万卡集群的超节点。

2. 通用计算超节点:TaiShan950 SuperPoD(2026Q1 上市)


基于鲲鹏 950 CPU 构建,支持 16 节点(32P)扩展,内存容量达 48TB,结合 GaussDB 分布式数据库,可替代传统大型机与 Exadata 一体机,在金融、电信等关键行业实现核心业务系统的国产化替代。

技术突破:华为通过灵衢 2.0(UnifiedBus)协议实现超节点内异构算力的统一调度,该协议已全面开放,包括《灵衢基础规范 2.0》《固件规范 2.0》等,吸引产业链伙伴共建开放生态。

关键要点:

1. 低成本HBM和计算能力的提升

华为自主研发了低成本HBM(高带宽内存),使其计算能力每年翻一番。该公司还宣布支持FP8等多种精度格式,并承诺提供更宽的互连带宽。

2. 超级节点策略

徐直军表示,基于昇腾芯片,华为将满足客户的算力需求,超级节点将成为AI基础设施的新标准。

3. 全球最强超级节点

他宣布,基于昇腾950芯片打造的全新超级节点将于今年第四季度上线,这将是全球算力最强的超级节点。

徐直军强调,该系统甚至将超越NVIDIA计划于2027年发布的NVL576系统。

4. 未来路线图

基于Ascend 960的超级节点也预计将于2027年第四季度发布,确保稳定强大的计算能力供应。

5. 其他技术公告

华为还透露了鲲鹏950、960系列等通用计算处理器的更新计划。

6.互联互通协议“灵衢”

为了连接更大的计算资源池,华为推出了全新的超级节点互联协议“灵趣”,通过该技术,昇腾950可扩展至50万卡以上的集群,昇腾960则可支持99万卡以上的集群。

其中,950架构解读:

1) 低精度支持

2) 提升向量算力

3) 提升互联带宽2.5倍

三、全光互联技术:开启算力集群新纪元

为应对超节点间数据交互的指数级增长,华为推出超节点全光互联方案,通过重构光器件、光模块与互联芯片,实现高可靠、低时延的光域算力协同。

1. 技术突破方向

OCS 光交换机:采用 MEMS 与液晶双技术路径,跨柜卡间带宽>1TB/s,相比传统电互联方案功耗降低 40%。华为在深圳光博会展示的 MEMS 方案 OCS 交换机已进入商用阶段,预计 2026 年全球出货量突破万台。

光模块与芯片:自研 800G/1.6T 光模块,支持 CPO 共封装光学技术,配合昇腾芯片内置的光互联控制器,实现 “芯片 - 模块 - 交换机” 全链路协同优化。

2. 生态协同

华为联合光库科技、腾景科技等合作伙伴,构建从 MEMS 芯片、光环形器到整机代工的完整产业链。例如,光库科技的 MEMS 光开关已应用于 Atlas 950 SuperPoD,德科立的硅光模块支撑跨集群数据传输。

四、重点受益环节与公司

1.代工与封装:

中芯国际:独家承接昇腾 950 代工,良率约 40%,2025 年产能爬坡至每月 1.2 万片;

长电科技:采用 XDFOI Chiplet 技术集成 7nm CPU 与 28nm AI 加速器,性能媲美 5nm 单片芯片,支撑昇腾 950 算力释放效率提升 8%

2. 服务器代工与算力基础设施:

拓维信息:旗下湘江鲲鹏年产能 20 万台昇腾服务器,占华为总出货量 70%,中标长沙、重庆等国家级智算中心 80% 硬件供应;

神州数码:通过华鲲振宇切入,2024 年昇腾服务器市占率超 30%,中标中国移动 20 亿元集采订单。

集群部署:华为 Atlas 950 SuperPoD(8192 卡)采用华丰科技的 56Gbps 高速背板连接器(单机价值量 3000 元,市占率 60%),并配套高澜股份的浸没式液冷方案(能耗降低 40%)。

3. 核心组件与生态配套:从 HBM 到光模块的国产化突破

1.)存储与散热:

兆易创新:通过合资公司华坤凯德切入昇腾服务器 SSD 存储,自研主控芯片适配鲲鹏平台;

国机精工:金刚石散热基板导热性能提升 40%,已向华为批量供货,支撑昇腾 950 芯片在高密度算力场景的稳定性。

2.)光互联:

中际旭创:独家供应昇腾 384 超节点的 1.6T 光模块,单集群需 6912 个模块,华为订单占其营收 15%;

华工科技:800G 光模块通过华为认证,2025 年昇腾供应链份额预计突破 30%

你认为本次华为昇腾是否会有大的爆发?谁才是你心中的白马王子呢?

来源:伍哥说机会一点号

相关推荐