摘要:近期召开的英伟达年度GTC大会上,液冷技术成为新品亮点。英伟达新一代Blackwell Ultra通过“液冷+硅光子”的协同进化,基于5nm工艺,单颗芯片集成288GB HBM3e显存,FP4算力达15PetaFLOPS,而DGX GB300系统采用Grace
本报记者 袁传玺
近期召开的英伟达年度GTC大会上,液冷技术成为新品亮点。英伟达新一代Blackwell Ultra通过“液冷+硅光子”的协同进化,基于5nm工艺,单颗芯片集成288GB HBM3e显存,FP4算力达15PetaFLOPS,而DGX GB300系统采用Grace Blackwell Ultra超级芯片,以及机架级液冷设计,较上一代 Hopper 架构可提供70倍的AI性能。
不仅如此,英伟达推出开源推理框架Dynamo,通过革命性的液冷方案,将海量计算节点浓缩进单一机架,整套液冷系统功率达120kW,单机架可实现百亿亿次计算。黄仁勋透露,2027年下半年预计推出Vera Rubin Ultra,每个机架功率将高达600kW。分析师预计Vera Rubin也将全面转向浸没式液冷散热。
市场人士表示,此举将液冷技术推到了全球AI产业的风口浪尖。国内领先的液冷解决方案提供商网宿科技股份有限公司旗下深圳绿色云图科技有限公司(以下简称“绿色云图”)运营总监徐明微坦言,这标志着液冷时代的全面来临,预计今年内液冷渗透将大幅提速。
液冷成为AI算力标配
早在2022年,英伟达就推出过液冷版A100,去年英伟达在其B100、H200芯片上正式从风冷散热升级为液冷散热。据英伟达官方数据,H200在高负载任务下产生的热量较前代产品增加了约30%,为了确保H200的稳定运行和持续高性能输出,引入了液冷散热技术,实验对比显示,液冷散热效率较传统风冷提升了约50%。
此次英伟达对其系列新品采用液冷散热,进一步体现了其在液冷技术上的决心。
华尔街分析师Hans Mosesmann也指出,液冷技术对于克服AI云端运算挑战非常关键,能为超大规模云端服务铺路。徐明微则表示,英伟达的这一选择正佐证了液冷技术是AI算力的标配。
眼下AI算力的市场需求扩大,作为核心承载的芯片性能和功耗水平已经提升到了一个新的量级,高功耗输出也对液冷技术提出了更高要求。在徐明微看来,保障AI芯片的性能与运行稳定尤为关键,这要求液冷系统更加安全可靠。
液冷市场迎来“奇点”
不只是英伟达,微软、谷歌、Meta、英特尔等AI巨头都在加快渗透液冷技术。如微软与Wiwynn合作开发两相浸没式液冷方案,已在其华盛顿州的数据中心运行。英特尔则与绿色云图合作开发了新一代G-Flow浸没式液冷方案,突破当前单相油冷浸没式冷却的技术瓶颈,实现了kW级散热。
在国内,政策与产业也在加速推动液冷发展。三大运营商2023年联合发布的《电信运营商液冷技术白皮书》中提出,2025年开展(液冷)规模应用,50%以上项目应用液冷技术。《上海市智能算力基础设施高质量发展“算力浦江”智算行动实施方案(2024—2025年)》中明确,力争到2025年上海市新建智算中心PUE值达到1.25以下,智算中心内绿色能源使用占比超过20%,液冷机柜数量占比超过50%。
无疑,液冷产业链将顺势迎来发展强心针。中信证券认为,具有全链条能力的液冷系统解决方案厂商将更具潜力。
业内人士表示,液冷系统厂商是集大成者,打通了从研发、测试、验证到生产、交付、运营的所有环节,技术储备更为完备,经验最为丰富,并且有能力协同上下游,通过产业供应链来加快推动液冷技术的研发与应用,将率先收获机遇。
以绿色云图为例,作为国内最早专攻液冷技术的企业,已构建起从研发、测试、生产到交付的全栈能力,并且其液冷产品已在诸多领域规模应用,技术成熟度、稳定性、可靠性方面得到了市场长时间的验证,拥有领先的技术和能力壁垒。同时,绿色云图近年来积极与芯片、服务器、冷却液等厂商以及科研院所合作,产业生态资源较为雄厚。
徐明微透露,绿色云图现已交付多个液冷智算中心项目,为国内AI厂商提供稳定、可靠、高效的智算服务。“产业需要共同迈向安全、高效、标准化,离不开上下游协同。从芯片、服务器到液冷系统,各环节需把控安全、推动技术融合,同时亟待建立统一标准。但挑战仍多,需行业携手,探索前行。”
来源:证券日报