AI算力基建重大共识!超节点成核心方向,国产芯片集体突破

B站影视 韩国电影 2025-09-25 19:43 2

摘要:核心主题:随着AI大模型规模急剧扩大(如从千亿参数到万亿参数),传统算力架构无法满足高带宽、低时延、持续数据供给的需求,计算基础设施需转向超节点架构。

核心主题:随着AI大模型规模急剧扩大(如从千亿参数到万亿参数),传统算力架构无法满足高带宽、低时延、持续数据供给的需求,计算基础设施需转向超节点架构。超节点的演进与技术特征。AI算力需求空间与趋势。国产芯片在超节点布局的进展。

超节点是一种结合硬件互联和软硬件协同的架构,通过纵向扩展(Scale-up)方式提升性能:

基础特征超高带宽互联:采用高效互联协议(如华为UB、英伟达NVLink),实现处理器间大流量数据传输。例如,华为Atlas 950带宽达16PB/s,是现有互联网峰值带宽的10倍以上。内存统一编址:全局内存地址唯一化,消除序列化-网络传输瓶颈,提升参数同步效率(如大模型训练中的小包数据传输)。未来优化方向资源池化:抽象化为统一逻辑资源池(如内存、存储),实现动态调度(如KV Cache池化解锁长上下文处理)。资源灵活配比:基于任务特征(计算/访存密集型),自动调整CPU、NPU、内存等资源比例,支持多任务逻辑切分。产业演进:从传统Scale-out架构(以太网互联)转向Scale-up超节点架构,满足万亿参数模型需求。需求来源云服务提供商(CSP):多家CSP上调资本开支:Google上调2025年CapEx至850亿美元。Microsoft Q2 CapEx达242亿美元,Q3预计超300亿美元。Meta预计2026年CapEx加速增至660-720亿美元。Oracle FY2026Q1 CapEx同比增长269%至85亿美元。阿里巴巴重申三年3800亿人民币AI资本开支计划。推理需求崛起:腾讯和甲骨文指出,产业重心正从训练转向推理(甲骨文称推理市场“远大于”训练市场)。主权AI兴起:国家主导的投资如欧盟AI工厂(200亿欧元)、美国Stargate计划(5000亿美元),英伟达预计2025年主权AI收入可达200亿美元,鸿海预计未来五年投资超1万亿美元。

国产品牌加速突破,引领AI基础设施创新:

华为:Atals 900超节点(2025年3月):满配384颗Ascend 910C芯片,全球已部署超300套。Atlas 950/960超节点(2025年9月发布):950支持8192颗Ascend 950DT,算力8EFLOPS FP8,内存1152TB;960支持15488颗芯片,算力30EFLOPS FP8,性能提升显著。集群产品:Atlas 950 SuperCluster(50万卡)算力524EFLOPS FP8,Atlas 960 SuperCluster(百万卡)算力2ZFLOPS FP8。开放“灵衢2.0”互联协议,支持万卡级架构。发布全球首个通用计算超节点TaiShan 950。中科曙光:发布AI超集群系统(2025年9月),基于开放架构支持多品牌AI卡和CUDA生态,降低成本和适配难度。浪潮信息:“元脑SD200”超节点服务器(2025年8月),首创三维网格架构,支持64路GPU高速互联,显存统一寻址空间达4TB。沐曦股份:推出光互连超节点(曦云C500X)、3D Mesh互联超节点(耀龙S8000G2)及液冷整机柜(Shanghai Cube)。曦智科技:发布光互连光交换GPU超节点“光跃LightSphereX”,支持硅光dOCS芯片技术。核心逻辑:能够突破物理极限、定义标准、实现智能调度和可靠运维的企业将成为主导者。AI处理器:海光信息、寒武纪。CPU:海光信息、中国长城(飞腾信息)、龙芯中科。

本报告系统阐述了AI算力需求向超节点架构的转型,超节点通过高带宽互联、统一编址和资源池化解决了传统架构瓶颈。全球AI资本支出预期达数万亿美元,推理需求和主权AI成为增长亮点。国产芯片厂商(华为、中科曙光、浪潮信息等)在超节点产品上取得突破,技术领先性支撑行业“推荐”评级。

来源:禾略研究院

相关推荐