AI 服务器催生48V电源架构,这项技术也在升级

B站影视 电影资讯 2025-04-03 10:10 1

摘要:随着 AI 芯片性能的指数级增长,服务器功耗呈现爆发式上升。以英伟达为例,其 B200 GPU 单芯片功耗达 1000W,GB200 更突破至 2700W,驱动单机柜功率从20kW跃升至120kW以上。传统 12V 电源架构在高功率传输时正在面临严重瓶颈:电流

随着 AI 芯片性能的指数级增长,服务器功耗呈现爆发式上升。以英伟达为例,其 B200 GPU 单芯片功耗达 1000W,GB200 更突破至 2700W,驱动单机柜功率从20kW跃升至120kW以上。传统 12V 电源架构在高功率传输时正在面临严重瓶颈:电流激增导致 I²R 损耗剧增,散热成本攀升,同时线束体积与重量限制了系统扩展性。这迫使数据中心必须采用更高电压的电源架构以应对挑战。

随着48V电源母线的升级,对于热插拔(Hot-Swap)技术也有着相应的改变。本文将从48V电源架构变革开始介绍,之后详细介绍热插拔技术及新品。

一、48V 架构的核心优势

选择48V系统,会有很多优势,其中包括:

能效提升与损耗降低

48V 系统通过降低 4 倍电流,使传输损耗减少 16 倍,显著提升能源利用率。例如,12V 系统传输 12kW 需 1000A 电流,而 48V 仅需 250A,配合母线优化设计,整体效率可提升 10%-15%。

高密度与空间优化

48V 架构支持更小的导线和元件,减少线束占用空间,同时通过垂直电源流设计(如将 VRM 模块置于芯片底部),缩短电流路径,进一步降低损耗并提升功率密度。

兼容性与演进路径

48V 架构与现有基础设施(如 48V 备用电池系统)兼容,同时为未来向更高电压(如 ±400V)过渡奠定基础。通过模块化设计(如 PRM 预调节模块 + VTM 电压转换模块),可灵活适配不同算力需求,支持 5:1、8:1 等多种转换比。

二、与传统电源架构的差异

关键技术创新

为了48V系统的高功率密度,电源管理需要持续的创新,比如:

高效转换拓扑

ZSC 零电压开关技术:实现负载无关的软开关,支持高频切换(>1MHz),降低开关损耗。

HSC 混合开关电容技术:结合电容与磁性元件,提升转换效率与功率密度,适用于 5:1 以上高降压比场景。

智能电源管理

通过实时监测电压、电流与温度,结合预测性维护算法,优化能源分配并降低故障风险。例如,BBU 电池备份单元在市电中断时,可通过超级电容快速响应(

材料与封装升级

采用氮化镓(GaN)、碳化硅(SiC)等宽禁带半导体,提升开关速度与耐压能力;优化封装设计(如倒装芯片),增强散热效率与可靠性。

三、热插拔的重要性

在 AI 服务器中,热插拔(Hot-Plugging)是一种关键技术,主要是由于需要保障系统连续性与高可用性,减少停机损失,热插拔允许在不关闭系统的情况下直接更换,避免整体停机。

但是热插拔过程中存在着诸多关键挑战。首先是浪涌冲击,插入时,输入电容瞬间充电导致高达 4.3kA 的浪涌电流,可能损坏设备或引发系统电压骤降。

此时,使用 MOSFET 作为电流控制器,通过调节栅极电压(V GS)限制电流。结合安全工作区(SOA)曲线,确保 MOSFET 在高电压(如 60V)下的安全运行。

控制器需根据 MOSFET 的 SOA 曲线可以动态调整电流,避免过热或击穿。

四、几款重要热插拔应用新品

英飞凌科技日前宣布扩展旗下XDP数字保护产品系列,推出 XDP711-001。这是一款拥有 48 V 宽输入电压范围的数字热插拔控制器,具备可编程安全操作区域(SOA)控制且专为高功率 AI 服务器设计。该控制器拥有出色的输入及输出电压监控与报告功能,精度达 ≤0.4%,还有系统输入电流监控与报告功能,在全 ADC 范围内精度达≤0.75% ,可提升系统的故障检测和报告准确性。

XDP711-001热插拔控制器采用脉冲 SOA 电流控制技术,即使在未采用最佳场效晶体管(FET)的系统中也能实现更安全的开启,从而降低系统物料(BOM)成本。这一XDP产品系列的新成员专为驱动多个并联 MOSFET而设计,支持高功率设计这一AI服务器的关键需求。

XDP711-001 采用三区块架构,该架构结合用于监控和故障检测的高精度遥测技术、针对功率MOSFET优化的数位 SOA 控制,以及能够驱动最多8个N型功率 MOSFET的高电流整合式驱动器,支持4 kW、6 kW和8 kW电力传输板(PDB)设计。这款新型热插拔控制器可在 7 V 至 80 V宽输入电压范围内运行,并能承受高达100 V的瞬时电压长达500毫秒,提供 ≤1.15% 精度的输入功率监控和报告。它具备兼容高速 PMBus的主动监控功能,可提升系统可靠性。在严重过电流(SOC)情况下,可编程栅极关闭功能可于短短1微秒内迅速且确实地执行关闭操作。其他功能包括 IMON、PMON 以及突波抗扰能力,能进一步提高系统可用性。此外,全数字操作模式能大幅减少外部组件需求,实现紧凑的解决方案,使其成为空间受限的设计中兼具成本效益的理想选择。

通过外部FET选择和一次性可编程(OTP)选项,XDP711-001可针对各种使用模式,灵活进行故障和警告侦测,以及去抖动(de-glicth)定时器的程序设计。其模拟辅助数字模式(AADM)则可向下兼容传统模拟热插拔控制器。

英飞凌科技IC产品线副总裁 Magdalene Boebel 表示:“英飞凌XDP711-001热插拔控制器凭借功能丰富的高精度模拟前端,以及全面的健康监控、遥测、可编程性和预设MOSFET SOA,将能够出色应对当前可插拔AI服务器解决方案设计中的挑战。XDP711-001强大的功能和适应性体现了英飞凌对创新的不懈追求,为AI服务器及其他应用(如网络路由器和交换机)树立了系统可靠性的新标杆。”

近日,罗姆也面向企业级高性能服务器和AI服务器电源,开发出实现了业界超低导通电阻和超宽SOA范围的Nch功率MOSFET。新产品共3款机型,包括非常适用于企业级高性能服务器12V系统电源的AC-DC转换电路二次侧和热插拔控制器(HSC)电路的“RS7E200BG”(30V),以及非常适用于AI服务器48V系统电源的AC-DC转换电路二次侧的“RS7N200BH(80V)”和“RS7N160BH(80V)”。

不过德州仪器认为,随着功率需求的增长通常导致解决方案体积增大、设计复杂化,并增加故障检测与保护的难度。此外,在确保安全运行和最小化功率损耗的同时管理大电流成为关键问题。传统热插拔控制器与分立FET的组合在高功率应用中面临显著限制。

为应对这些挑战,德州仪器推出集成电源路径保护的 48V 热插拔电子保险丝(eFuse)器件,专为数据中心应用设计,具有高可靠性和紧凑性。与需要外部检测电阻和电流检测放大器的方案不同,TPS1689 和 TPS1685 通过集成这些功能简化了设计,在支持高功率无缝扩展的同时,将解决方案尺寸缩减高达 50%。

TPS1689 的差异化特性之一是消隐定时器,它通过使系统区分峰值负载电流和实际故障条件来防止误触发。该功能增强了系统可靠性,避免不必要的停机。器件还支持堆叠功能以提升电流处理能力,允许多个器件在高功率应用中协同工作。

集成的故障记录黑匣子、FET 安全工作区保障、主动均流和健康监测等特性进一步增强了系统弹性。TPS1689 采用行业标准通用封装,提供确保可靠运行的电源管理解决方案。

五、未来演进趋势

更高电压演进:48V 架构作为过渡方案,正推动数据中心向 ±400V 高压直流系统发展,以支持 500kW 以上单机柜功率需求。

液冷与能效协同:结合液冷散热技术,进一步提升系统能效比(PUE),目标将数据中心整体能耗降低 30% 以上。

AI 与电源融合:利用 AI 算法动态优化电源分配,预测负载变化,实现全系统智能调度。

来源:电子工程世界一点号

相关推荐