摘要:如今,HBM不再是一个小众产品,它已经成为AI革命的核心。作为推动AI技术飞跃的基础设施,HBM的崛起不仅仅是一项技术进步,更是对传统内存瓶颈的有效突破。它通过将多个内存Die垂直堆叠,大幅提升了带宽和数据传输效率,让处理速度更快、传输路径更短。与传统的GDD
如今,HBM不再是一个小众产品,它已经成为AI革命的核心。作为推动AI技术飞跃的基础设施,HBM的崛起不仅仅是一项技术进步,更是对传统内存瓶颈的有效突破。它通过将多个内存Die垂直堆叠,大幅提升了带宽和数据传输效率,让处理速度更快、传输路径更短。与传统的GDDR和LPDDR内存相比,HBM的迭代速度更是飞跃式的,其带宽增长令人惊叹,远远超越了以往的标准。
HBM市场竞争格局中,SK海力士和三星是当之无愧的主角,它们在2024年合计占据了超过90%的市场份额(SK海力士54%,三星39%)。而美光则扮演着追赶者的角色,占据7%的市场份额。
这三家巨头,都在为下一代“王牌”——HBM4 摩拳擦掌。在2025年的闪存峰会(FMS)上,它们纷纷亮出自己的肌肉,给HBM4贴上了各种高标签,比如“重新定义内存”、“下一代里程碑”。。。HBM4以箭在弦上,争夺HBM领导地位的竞争已成为全球舞台上的一场战略性竞赛。
巨头们的三国杀SK海力士:性能和效率,我全都要!
随着功耗成为重要限制因素,HBM正在向着性能和效率的平衡方向发展。SK海力士认为,HBM的引入能够显著提升AI的性能和质量,甚至超越了传统的内存性能增长速度,从而打破了所谓的“内存墙”瓶颈。
SK海力士将HBM定位为“近内存”(Near-Memory),即在内存层次结构中,HBM比传统主内存(DRAM)更接近计算核心(CPU/GPU),因此具有更高的带宽和更快的响应速度。
SK海力士的底气源于HBM的三大结构优势:通过3D TSV(硅通孔)堆叠实现高容量;通过宽通道并行传输实现高带宽;以及在单位比特传输上比传统DRAM更低的能耗,从而实现了更高的能效。这些结构上的创新正是HBM能够大幅提升系统性能、尤其是在AI等高吞吐量应用中发挥关键作用的核心原因。
在HBM2E、HBM3、HBM3E和HBM4的代际演进过程中,SK海力士实现了HBM的带宽显著提升,能效越来越高。值得注意的是,在HBM3E到HBM4的过渡中,带宽增加了“200%”(即提升到原来的三倍),显示出HBM4在带宽上的巨大飞跃。
SK hynix已经出货了世界上第一批HBM4样品。HBM4在美元/带宽/功耗/散热方面,整体优势比前代提升60%。HBM4的容量最高可达36GB,足以处理高精度的大型语言模型(LLMs)。带宽超过2TB/s,可以在一秒钟内下载一部全高清(5GB)电影;比HBM3E的能效低约40%多,散热性能提升约4%。
三星:步步为营
三星也将HBM视为近存的一种,三星在FMS上介绍了其HBM的演进路线,自2018年一直到2027年,HBM的带宽不断提升:HBM2 (2018年)带宽为307 GB/s—>HBM2E (2020年)带宽提升至461 GB/s—>HBM3 (2022年)带宽大幅提升至819 GB/s—>HBM3E (2024年)带宽进一步提升至1.17 TB/s—>HBM4 (2026年)带宽预计将达到2.048 TB/s。到2027年,三星预计其HBM4E将超越HBM4,拥有更大容量、更高带宽、更强的可控性。
三星HBM的技术指标
从HBM2到HBM4E,为了实现更高的容量和带宽,芯片尺寸在不断增加。与此同时,功耗的上升是高性能和高带宽带来的必然结果,HBM的功耗从12W增加到了42.5W,但这确实对散热设计提出了巨大的挑战。
尽管总功耗在增加,但能源效率却在持续降低。从HBM2的6.25 pJ/bit一直下降到HBM3E的4.05 pJ/bit。值得一提的是,2024年三星的HBM3E的芯片尺寸(121.0 mm2)与HBM3保持一致,但能源效率却由4.12 pJ/bit下降到了4.05 pJ/bit。这表明了显著的技术进步,这对于数据中心和AI应用至关重要,因为功耗是运营成本和散热设计的一个主要挑战。
三星将HBM4& HBM4E是下一代里程碑,据三星的介绍,HBM4的一个关键的技术变革是从传统工艺到FinFET工艺。这种“逻辑工艺变革”所带来的具体优势有三点:一是提升高达200%,二是面积减少高达70%,三是功耗减少高达50%。
三星还介绍了其用于HBM堆叠的创新封装技术——HCB。其实也就是混合键合技术,HCB实现了HBM Die(芯片)之间以及Die与中介层(interposer)之间无缝、直接的连接,而不是通过传统的微凸点(micro-bumps)焊接。
采用HCB技术相比传统技术 TCB(Thermo-Compression Bonding,热压键合),可以支持HBM的堆叠层数提升高达33%,由于HCB的无间隙特性和更小的连接间距,它可以支持更高的堆叠层数,从而在相同面积下实现更大的总容量;热阻提升高达20%,HCB的无间隙直接连接,提供了更短、更高效的热传导路径,从而为更高的功耗提供更好的散热支持。
美光:后来者能否追上?
美光对于HBM4倒是轻轻带过,介绍了许多其他内存产品,如G9 QLC/TLC NAND、PCIe 6 SSD。
在这场HBM的竞赛中,美光虽然起步稍晚,但步子迈得却很坚定。他们直接跳过了HBM3,用HBM3E直接杀入市场,成为英伟达H200 GPU的重要供应商。目前,美光正加速推进HBM技术迭代,计划于2026年推出HBM4。
美光的HBM4采用12层内存Die堆叠设计,相较于HBM3E的24 GB和36 GB容量选项,HBM4以36 GB为主要规格。带宽从HBM3E的1.2 TB/s大幅提升至超过2 TB/s,配备2048-bit超宽接口,能效较前代提升超20%。
HBM4之后,美光并未明确HBM4E的路线图,只说未来HBM4E将持续朝更高带宽、更大容量、更高能效及更强定制化方向发展。
HBM制造的复杂性虽然路线图看起来各家都在按部就班的进行,但是需要知道的是,HBM制造过程非常复杂。按照SK海力士的信息,HBM的生产制造大约需要经过前端和后端的七大主要步骤:1)硅刻蚀—>2)TSV铜填充—>3)BEOL金属化—>4)前端凸点形成与焊料回流—>5)临时载体结合和背面研磨—>6)在晶圆背面形成凸点—>7)载体解离、芯片堆叠和封装。(1-4为前端制程,5-7为后端制程)
TrendForce分析师认为,HBM技术的核心发展策略,主要是通过前端工艺的改进,来提升带宽和单Die密度。例如,提升I/O数量需要更多的TSV(硅通孔)和bumps/pad(凸点/焊盘)。TSV是HBM堆叠的关键技术,用于连接垂直堆叠的芯片;提升单 Die 密度同样需要改进前端工艺。不过随着HBM的Die尺寸持续增大,导致每GB成本更高。
但与此同时,后端工艺的进步也是HBM技术发展的另一面。后端工艺的核心目标是增加堆叠层数。三大 HBM供应商采用不同的堆叠技术,其中海力士以MR-MUF著称,三星和美光则主要使用TC-NCF。
HBM 堆叠技术的解读:
TC-NCF(Thermo-Compression Non-Conductive Film):一种使用非导电薄膜进行热压键合的技术,其制造工艺需要在堆叠每一层芯片时都采用高温(>300°C)高压,这会导致更长的循环时间。
MUF(Mass Reflow Underfill):一种在封装过程中使用塑封材料(Underfill)填充芯片之间间隙的技术,海力士在这一领域有独特的优势。与TC-NCF相比,MR-MUF工艺是将所有存储芯片都放置到缓冲芯片上之后,一次性进行大规模回流焊。这个过程采用低温(
16层堆叠的工艺尚不确定,可能是Hybrid Bonding(混合键合)或继续使用 TC-NCF/TC Bonding。16 层堆叠的 Die 间隙非常小,大约 5 微米,对 Die 的核心高度(20-25 微米)提出了严格要求。
Market and technology Trends分析师也认为,2026年,HBM4 (12层) 和 HBM4e (16层) 可能开始采用新的键合技术。从2028年的HBM5(20层)开始,晶圆到晶圆(W2W)混合键合将成为主流,而芯片到晶圆(D2W)键合也将在随后的世代中扮演重要角色。
不仅是工艺,HBM的架构创新也很关键。HBM正在从“标准HBM”(s-HBM)向“定制HBM”(c-HBM)发展。定制HBM将部分原本位于GPU/ASIC上的HBM PHY和逻辑功能集成到HBM的基底芯片中,从而实现更短的通道长度、更少的I/O数量和更低的功耗,显著提升系统性能和降低总拥有成本(TCO)。
HBM市场前景光明,但并非一帆风顺根据Yole Group的数据,无论是从收入、位出货量还是晶圆生产量来看,HBM市场未来几年都呈现出高速增长的态势。
从收入金额来看,全球HBM收入预计将从2024年的170亿美元增长至2030年的980亿美元,复合年增长率达33%。HBM在DRAM市场中的收益份额预计将从 2024 年的 18% 扩大到2030年的50%。
从位出货量来看,HBM从2023年的1.5 B GB,到2024年的2.8 B GB。到2030年,预测将达到7.6 B GB。HBM位出货量占DRAM市场总出货量的份额,从2024年开始快速增长,到2030年预测达到10%左右。
在HBM晶圆生产量方面,从2023年的216 K WPM,到2024年的350 K WPM。到2030年,预测将达到590 K WPM。HBM晶圆生产量占DRAM市场总晶圆生产量的份额,到2030年预测达到15%左右。
尤为注意的是,尽管HBM的位出货量占DRAM市场的份额(~10%)相对较小,但其收入占比却能达到接近50%,这凸显了HBM的高附加值和高单价,也解释了为什么晶圆生产量(~15%)的占比介于收入和位出货量之间。目前HBM的每比特成本是DDR的约3倍,到HBM4时将增至4倍。然而,由于高需求,HBM的定价是DDR的约6倍(HBM4将是8倍),毛利率远高于DDR,达到70%。
不过,MKW Ventures Consulting LLC的分析师也发出了警告:当新技术热度高涨时,往往伴随着夸大的预期,要警惕过渡炒作的风险。此外,在快速增长的市场中,修正和周期性是常见的:由于主要供应商(SK海力士、三星、美光)的产能增加,可能导致供应过剩,进而引发市场修正,市场终将进入一个“消化”阶段,增长减少,没有备用订单,没有库存积累,只有过剩的库存,10%的下降可能变成30%的下降。HBM市场的超高速增长率将从2024/2025年的100%下降到2026年的20%。
顺便提一下,半导体(特别是内存市场)即将进入修正期的一些关键指标可以作为参考:
终端客户收入增长的任何小问题:如果终端客户(例如诺基亚)的收入增长因任何原因出现问题,这可能是一个早期信号。库存增长:终端客户或内存公司的库存开始增长。位增长,但利润增长放缓:内存公司的位出货量在增长,但利润增长却放缓。这通常是由于竞争加剧导致价格侵蚀。供应突然增加:新的产能上线,例如三星获得资格或美光的新工厂投产。“消化”一词的使用:当超大规模数据中心运营商或英伟达开始使用“消化”(Digestion)这个词时,这通常意味着需求放缓。CFO的言论:当内存公司CFO发表“这只是短期调整,细分市场仍然强劲”之类的言论时,这可能是一个反向指标。2026年底的供过于求:如果2026年底出现供过于求,定价将变得激进。HBM独特的供应链:HBM拥有独特的供应链,DDR和HBM之间的灵活性极小/很慢。HBM毛利率下降:HBM的毛利率将至少降至40%或更低。因此,尽管HBM市场前景光明,但其发展并非一帆风顺,将不可避免地经历周期性的调整。
虽然目前HBM还是存储巨头的天下,但是不可忽视的一点,中国正在加大力度实现HBM生产的本地化。强大的国内AI加速器需求、大量的政府支持以及成熟的产业网络,很可能在未来几年内为中国企业在HBM市场赢得重要的立足之地。
来源:乔布斯北京分斯