2纳米芯片来了!谁会赢?

B站影视 2025-02-06 17:31 3

摘要:2025年,超大规模企业的定制加速器将对NVIDIA构成最大威胁。对于英特尔和AMD等其他商业供应商来说,挑战将来自基于新2纳米制程的加速器,但这些产品可能要到2026年才会面世。

先总结今年几个相关趋势预测:

1、NVIDIA将在AI领域保持领先,但会失去一小部分市场份额

2025年,超大规模企业的定制加速器将对NVIDIA构成最大威胁。对于英特尔和AMD等其他商业供应商来说,挑战将来自基于新2纳米制程的加速器,但这些产品可能要到2026年才会面世。

2、尽管AI功能采用缓慢,PC和边缘芯片的NPU竞争将继续

在PC领域,神经处理单元(NPU)的竞争将持续。如果Arm的诉讼继续(该公司可能会上诉),AMD和英特尔将仅在Windows芯片上展开竞争。如果法庭诉讼迅速结束,可能会看到一些有趣的新参与者利用Arm架构。对于低功耗AI边缘和物联网应用,市场已经饱和,一些供应商将退出。

3、RISC和FPGA势头增强

RISC-V将在多类芯片中继续获得关注,部分原因是公司为避免仅依赖Arm架构而采取的对冲策略。另外,FPGA市场将重新焕发活力。

4、晶圆代工业务竞争加剧,首批2纳米芯片将出货

台积电在市场上占据主导地位,但在先进制程制造方面将面临激烈竞争。英特尔、三星和新进入者Rapidus都将寻求为新2纳米制程争取客户。英特尔将率先推出其18A制程,预计首批2纳米芯片将在2025年面世,首先是英特尔的Panther Lake芯片。

5、惊喜:英特尔卷土重来!

英特尔的18A制程为其陷入困境的产品线奠定了基础,Panther Lake将是首次真正考验。英特尔在2024年面临挑战,尤其是其AI加速器产品(Gaudi3),并且2025年不会推出新的AI加速器产品,暂时退出该市场,计划在2026年以Jaguar Shores回归。其AI收入太低,不会产生实质性影响。其更节能的设计和18A制程可能会让英特尔扭转局面,但其反弹的高度将取决于下一任CEO的战略和制程质量。

尽管2024年在供应基于B200的最新AI加速器方面面临挑战,NVIDIA作为数据中心AI市场领导者的地位似乎不可动摇——该公司将失去一些份额,但仍将远远领先于竞争对手。

过去三年,NVIDIA的数据中心收入增长了十倍以上,远超竞争对手AMD和英特尔。NVIDIA几乎所有的数据中心收入都来自其AI加速器,尽管有不到10%的收入来自其网络芯片。英特尔和AMD的数据中心收入则来自AI加速器和更传统的数据中心产品线,主要是Xeon和EPYC的CPU产品线。英特尔面临最大困境,未能实现Gaudi3的5亿美元销售目标。三年前,英特尔的数据中心收入是AMD的三倍多,而现在AMD已超越英特尔。然而,即使是AMD在2024年第三季度创下的35.5亿美元数据中心收入记录,与NVIDIA同期的310亿美元相比也相形见绌(图1)。

图1:三大数据中心计算供应商的数据中心收入,比较2021年第三季度(生成式AI热潮前)和最近季度的表现。NVIDIA是AI硬件支出增加的最大受益者,而英特尔在增长的市场中收入萎缩(来源:公司财务数据)

NVIDIA计划在3月推出其下一代产品(Rubin),但即使到那时,一些客户仍在等待一年前发布的Blackwell的交付。尽管可能面临供应链挑战,NVIDIA在硬件上的领先优势足以让客户愿意等待。

为了与NVIDIA竞争,英特尔和AMD都宣布了每年更新AI加速器的计划。2024年,这些更新主要是渐进式的,英特尔用Gaudi3取代了Gaudi2,而AMD在MI325X芯片中主要提供了内存改进。英特尔取消了2025年基于新架构Falcon Shores的新AI芯片计划,实际上退出了2025年的竞争,计划在2026年以Jaguar Shores回归。AMD将在2025年的MI350芯片中从CDNA 3架构转向CDNA 4架构,但要到2026年才会推出CDNA Next的重大架构更新。

英特尔和AMD在数据中心产品的能效方面取得了进展,但到目前为止,这一策略未能显著削弱NVIDIA的主导市场份额,尽管AMD在2024年确实取得了一些进展。然而,随着AI市场从训练(NVIDIA的强项)转向推理(能效是更重要的因素),英特尔和AMD有机会挽回一些失地。

2025年,NVIDIA最大的竞争对手可能是其自己的客户。大型科技公司通过设计定制加速器来优化数据中心效率,将“定制”融入客户需求。亚马逊、谷歌、Meta和微软等公司从NVIDIA采购一些AI加速器,但并不依赖单一供应商。对于这些大型科技公司来说,通常最大的其他供应商是它们自己。这一趋势将在2025年加强,并成为NVIDIA失去部分市场份额的主要原因。Marvell和博通成功支持了这些定制芯片的开发业务,将成为最大受益者,台积电作为关键制造供应商也将受益。

AI领域最大的变化可能是从主要作为数据中心技术向边缘AI计算的普及转变。AI早已成为智能手机的标准功能,但过去一年中,将NPU核心集成到低功耗边缘微控制器(MCU)和其他芯片中的趋势显著增加,同时这类芯片也在向64位处理过渡。ST、TI和Microchip等老牌厂商推出了几款有趣的芯片。较小的厂商则通过更大的内存以本地运行更大模型或更强的计算能力等特性寻求差异化。

随着众多产品的推出,这一领域迅速变得拥挤,而大多数终端芯片缺乏AI用例,即使AI可能带来效用,芯片厂商也往往缺乏集成AI的专业知识。认识到AI特有的挑战,较大的MCU供应商现在提供所谓的“模型动物园”——为常见用例预建的AI模型库。这使老牌公司相对于初创公司和其他小公司具有显著优势,后者通常无法承担所需的投资。尽管NPU集成是2024年的关键趋势,但在2025年,由于边缘物联网NPU市场过度饱和,一些公司将退出边缘AI市场。

在PC领域,尽管缺乏用例,AI已成为芯片厂商的卖点。所有主要厂商将在2025年继续提升PC SoC的NPU核心性能。然而,本地运行的AI工具推出缓慢(且采用率低),这意味着它不会引发厂商所期待的主要消费者PC更新周期的热潮。

RISC-V正显示出吸引力。2024年主要边缘物联网厂商推出了基于RISC-V的芯片,包括瑞萨和Microchip。RISC-V也悄然进入数据中心,Tenstorrent等AI初创公司选择RISC-V用于NPU核心。

RISC-V将进一步扩展到这些领域,这得益于生态系统的日益成熟。去年10月RISC-V峰会上推出的RVA23配置文件巩固了这一点。RVA23是一组RISC-V扩展,支持操作系统和应用程序的执行。它包括用于加速AI、机器学习和加密等数学密集型工作负载的矢量扩展,这些扩展被确立为RISC-V处理器与Android操作系统兼容的最低要求。RVA23配置文件还包括一个虚拟机管理程序扩展,以支持服务器和云计算应用中的企业工作负载虚拟化。业界期待2025年RISC-V领域进一步取得进展。

RISC-V正在并将继续进军Arm传统上强势的领域。多年来,低功耗边缘物联网芯片几乎完全由Arm核心主导。然而,Arm的边缘AI IP产品较弱,仅能提供4 TOPS,MCU/MPU厂商正转向RISC和定制架构的组合用于NPU核心。

Arm在PC领域也取得了一些进展,高通Snapdragon X Elite为Arm版Windows提供了推动力。但这一成功是短暂的,AMD、英特尔和苹果在几个月内就超越了高通的NPU。这确实激发了足够的兴趣,其他厂商也在考虑推出基于Arm的PC产品,特别是传闻中由NVIDIA和联发科联合开发的芯片。

Arm几乎通过起诉高通结束了后者的势头。可以说,Arm指令集架构赢了,但Arm Holdings(公司)在法庭上输给了高通;Arm Holdings的“成功”可能是这一倡议的终结。其他厂商将推出基于Arm的Windows PC SoC,但可能不会在2025年。如果Arm上诉,诉讼可能会继续,据报道Arm正在考虑修订其许可条款,因此对于希望进入这一领域的厂商来说,情况尚不明确。诉讼以及Arm据报道更广泛修订许可条款的意图,是RISC-V吸引力增强的另一个原因,因为厂商在对冲架构风险。

在数据中心,除了AI加速器外,服务器处理器的主导架构仍然是x86,这得益于英特尔和AMD成功的Xeon和EPYC产品线。英特尔的困境仍在继续,有传言称AMD正在开发基于Arm的设计(尽管这似乎不太可能,因为它会蚕食自己的收入)。尽管如此,两家公司宣布合作进一步推动x86发展,成立了x86生态系统咨询小组。英特尔曾表示希望最大化x86的价值,这可能意味着以更好、更简单的条款向更多被许可方开放,但在新CEO接管英特尔之前,这些都只是猜测。

在架构的另一端,无架构(或灵活架构)FPGA芯片将有新的发展。在计划IPO之前,Altera通过增加新的低功耗FPGA芯片扩展了其产品组合。TI也推出了其首款可编程逻辑芯片——尽管它们很简单,并未被称为FPGA,但这可能标志着其进入这一领域。Lattice也在12月增强了其中低端FPGA选项。FPGA作为机器人、辅助驾驶、增强现实等用例的传感器处理中心,正受到每台芯片传感器数量增加的推动。这些因素共同推动了对FPGA的重新关注。2025年这一市场将重新焕发活力。

今年,所有先进晶圆厂都将推出新的2纳米或更先进的制程。这些包括英特尔的18A制程、三星代工的SF2节点、台积电的N2制程,以及初出茅庐的Rapidus将推出其首个制程,简称为2纳米(表1)。

表1:2025年将推出的新先进晶圆制程总结(来源:晶圆厂)。BSP = 背面供电,FSP = 正面供电。

所有先进晶圆厂都在转向环绕栅极(GAA)晶体管,也称为纳米片晶体管,而(一如既往)英特尔有自己的命名:RibbonFET。对于三星来说,这将是第三个采用GAA的制程节点(SF3和SF3E制程也包含GAA);对于其他公司来说,GAA是新技术。SF2是其上一代SF3制程的演进,主要特点是提高了良率。三星的GAA芯片已经上市,但数量较少,最初在一款加密货币挖矿芯片Whatsminer ASIC中发现,更值得注意的是,其自家的Galaxy智能手表中的Exynos W1000处理器采用了SF3制程工艺。

英特尔在2011年率先从平面晶体管转向更高效的FinFET设计,但(当时)仅用于其自家产品。台积电“快速跟随”采用了该技术,可以说是其在高端晶圆代工业务中占据主导地位的原因。从FinFET到GAA的转变可能会引发晶圆代工领导地位的又一次变化——经过近40年,其他晶圆厂希望台积电遭遇中年危机。

为了追赶,其他公司不得不采取激进策略——三星两年前率先推出GAA,而英特尔则努力重拾昔日辉煌。然而,快速进展并不容易,且以较低良率为代价。台积电以可靠量产著称,这使其在竞争对手推出新功能时扩大了在先进制造领域的主导市场份额。

英特尔将率先推出另一项新技术,背面供电(BSP)。其PowerVia技术为18A制程增添了一些“魔法”。BSP承诺在2纳米制程增加的晶体管密度基础上进一步提升性能和能效。英特尔的Panther Lake芯片将在2025年底前上市,并将展示这种新电源配置在实际性能上的提升。

英特尔的晶圆代工竞争对手在这一领域进展较慢,其他宣布的制程仍使用成熟的FSP配置。台积电将在后续节点中引入BSP,预计从2027年的A16制程开始。三星也计划在2027年的SF2Z制程中引入BSP。Rapidus尚未宣布何时推出BSP供电。

英特尔进展最快,试生产已经就绪。它必须如此。英特尔一直使用台积电制造其最新芯片的芯片组(英特尔称之为“tiles”),这既是公司的尴尬,也降低了利润率。英特尔代工最重要的客户将是英特尔自己,公司预计将在即将推出的Panther Lake和Clearwater Forest芯片中恢复使用自家制造。为了展示信心,并表明芯片已开始在新制程中进行小规模生产,英特尔在2025年CES上展示了基于Panther Lake的笔记本电脑,预计这些芯片将在年底前上市。Clearwater Forest是其数据中心服务器CPU设计,预计将在下一代Xeon芯片中亮相,这些芯片可能在2025年底或更可能在2026年初出货。英特尔已宣布有多家外部客户排队等待18A制程,尽管目前唯一公开的公司是微软。预计英特尔将为微软的下一代Maia AI加速器制造18A制程芯片。

台积电也进展顺利,硅验证正在进行中,试生产预计将在1月开始。台积电尚未宣布2N制程的任何客户,但预计苹果将是其中之一。通常,苹果是台积电最新制程的早期客户,用于其iPhone移动SoC。尽管未经证实,业内预测2026年iPhone 18 Pro中的A20移动SoC将是首款采用N2制程制造的芯片。

三星尚未公布具体日期,仅表示智能手机应用的大规模生产将在2025年底前开始。2025年三星SF2制程的唯一芯片将是Exynos 2600移动SoC,预计将用于2026年推出的三星旗舰Galaxy S26手机。这将为其带来推动——三星Galaxy S25手机使用的是高通Snapdragon而非自家SoC。SF2将从2026年初开始用于移动以外的高性能计算应用(并可能向其他客户开放)。三星还宣布了两家韩国AI初创公司Rebellions和Preferred Networks作为客户,这些客户可能是小批量AI加速器。

Rapidus将最后进入大规模生产市场——这并不奇怪,因为它本质上是一家初创公司,还必须先完成其制造设施。尽管大规模生产计划在2027年开始,但它可能在此之前向小批量客户(如已宣布的Tenstorrent)交付产品,不过,业内预测2025年不会有任何Rapidus的芯片。由于Rapidus使用的是IBM的2纳米技术,可以合理推测IBM也将成为其客户。

2纳米级的胜利可能为赢家带来光明前景,新制程将在能效方面取得显著改进,这对于边缘和移动用例一直很重要,现在也是数据中心的主要因素。

来源:小宇科技观

相关推荐