GPU 风云突变,从宠儿到弃子

B站影视 2025-01-24 17:14 3

摘要:先聚焦于 GPU 面临的首要挑战。1 月 13 日晚间,拜登政府正式对外宣布,进一步加大对 AI 芯片及相关关键技术的出口管制力度,其目的在于限制中国等竞争对手获取先进 GPU 的能力。

曾经,GPU 于 AI 领域可谓风头无两。

可踏入 2025 年,这一局面却陡然生变,GPU 陷入了重重困境之中,面临着前所未有的严峻考验。

就在过去短短半个月的时间里,GPU 领域遭受了两大主要挑战的冲击

一方面是美国政府颁布的新禁令措施,如同一道紧箍咒,直接束缚了 GPU 的发展。

另一方面,ASIC 等定制芯片如雨后春笋般迅速崛起,给 GPU 市场带来了巨大的冲击与竞争压力。

接下来,让我们深入剖析这两大因素是如何具体影响 GPU 市场的。

01

美国收紧 AI 芯片出口

先聚焦于 GPU 面临的首要挑战。1 月 13 日晚间,拜登政府正式对外宣布,进一步加大对 AI 芯片及相关关键技术的出口管制力度,其目的在于限制中国等竞争对手获取先进 GPU 的能力。

依据已公布的详细信息,此次新规依据受管制程度的高低,将世界各国和地区清晰地划分为三大类别。

其中,日本、英国、韩国、荷兰、加拿大等 18 个与美国关系密切的盟友和合作伙伴,被列入豁免名单,他们能够自由地采购先进 AI 芯片。

而新加坡、以色列、沙特阿拉伯、印度、巴西、波兰等 120 多个国家和地区,则会受到 AI 芯片出口的配额限制

特别需要指出的是,中国、俄罗斯、伊朗、朝鲜等国家,被完全禁止获取高端 AI 芯片以及先进的封闭权重模型

管制新规进一步明确了一些特殊情况,小批量订单不会受到配额的影响。

具体而言,如果芯片订单的总算力未超过大约 1700 个先进 GPU,那么便无需获取美国的许可,并且不会被计入特定国家或地区进口芯片的限额之中,这一举措旨在保障来自大学、医疗机构和研究组织的 AI 芯片订单能够继续正常进行。

另外,根据美国商务部工业与安全局(BIS)官网的披露信息,美国企业在海外的数据中心建设同样将受到严格限制。

新规要求像亚马逊、微软、谷歌这类云服务提供商,必须将一半的受管制 AI 芯片部署在美国境内。

而部署在美国亲密盟友和合作伙伴之外地区的受管制芯片规模,不得超过 25%。

尤为关键的是,在美国亲密盟友和合作伙伴以外的任何单一国家和地区,部署的受管制芯片规模不得超过 7% 。

美国商务部长雷蒙多对此表示:“美国目前在 AI 开发以及 AI 芯片设计领域处于世界领先地位,维持这一优势地位至关重要。”

她同时强调,此次管制新规并非意在切断世界与 AI 创新的联系,而是专门针对限制海外最先进 AI 技术的发展。

需要注意的是,这份 AI 出口管制新规设置了 120 天的意见征询期,并且内容可以根据实际情况进行修改,这意味着后续将由特朗普政府最终敲定先进 AI 芯片的出口规则。

事实上,美国此前已多次出手,对中国大陆获取 GPU 芯片实施管制。这一做法产生了两方面的影响。

一方面,在一定程度上拖累了中国大陆 AI 能力的发展进程。

另一方面,也悄然改变了 GPU 的市场格局。受此影响,GPU 市场出现了两大显著变化。

GPU 市场的两大变化

首先,中国大陆本土 GPU 制造能力显著增强。近年来,国内众多 GPU 企业如雨后春笋般崭露头角。

通过持续不断地加大研发投入和努力创新,国产 GPU 在性能、功能以及应用领域等多个方面都取得了长足的进步,逐渐赢得了市场的认可和用户的信赖。

国产 GPU 不仅在传统的图形处理领域取得了突破性进展,在人工智能、高性能计算等新兴领域也开始展现出一定的竞争力。

其中,主要的厂商包括景嘉微、寒武纪、海光信息、天数智芯等。

尽管国产 GPU 芯片在技术层面已经取得了显著的进步,但与国际行业巨头英伟达相比,仍然存在一定的性能差距。

未来,随着计算需求的持续增长以及算法的不断优化,国产 GPU 芯片需要不断提升自身性能,以满足更为广泛的应用场景需求。

通过进一步加大研发投入,引入更为先进的制造工艺和设计理念,国产 GPU 芯片有望在未来实现重大的技术突破。

其次,英伟达等 GPU 行业龙头的出货能力受到了严重拖累

早在 2022 年 10 月以及 2023 年 10 月,美国商务部工业和安全局(BIS)曾两次更新对中国的先进半导体和计算设备的出口管制措施,在此背景下,英伟达为中国市场定制的特供版 GPU 产品 A800、H800 芯片均已受到管制。

与此同时,AMD 发布的性能最强的 MI300X、MI300A、MI250X、MI250 等多款 AI 芯片也不再能够出口到中国市场。

美国的出口管制政策,使得英伟达无法向中国市场提供最先进、性能最强的 GPU 产品,这极大地限制了其在华业务的拓展,尤其是在人工智能、云计算等对高性能 GPU 需求极为旺盛的领域。中国作为全球最大的半导体市场之一,失去这部分庞大的市场份额,对英伟达的营收增长带来了较大的压力。

尽管英伟达之后试图通过推出一些替代产品,如 HGX H20 GPU,来维持其在中国市场的份额,但整体出货能力仍然受到了较大的影响。

同时,这一情况也可能引发全球 GPU 市场格局的调整,其他国际竞争对手或许会趁机抢占英伟达和 AMD 在中国市场留下的空白,从而进一步加剧全球 GPU 市场的竞争态势。

AI 芯片出口管制新规的发布,也引发了英伟达的强烈批评。

英伟达政府事务副总裁 Ned Finkle 在 1 月 13 日发布的一篇博文中指出,基于美国的技术,AI 得以在全球范围内广泛应用,有力地推动了国内外各行各业的进步与发展。

然而,拜登政府试图推行的 “人工智能扩散”(AI Diffusion)规则,不仅前所未有,而且具有严重的误导性,这一规则可能会对全球创新和经济增长造成破坏。Ned Finkle 批评称,该管制新规不仅无法缓解任何实际威胁,反而会削弱美国的全球竞争力,动摇那种使美国能够保持领先地位的创新能力。

02

ASIC 崛起,冲击 GPU 市场

新年伊始,一股 ASIC 热潮迅速席卷全球。ASIC 热潮兴起的原因主要有以下三点。

首先,GPU 已然成为 AI 芯片领域竞争的核心焦点。目前,英伟达所产出的 GPU 产品主要被各大科技巨头所垄断。

其次,GPU 价格的大幅飙升,使得这些科技巨头在采购芯片时不得不支付更高的成本。

再者,即便科技巨头暂时将成本因素放在次要位置,英伟达本身存在的供应不足状况,仍然让这些科技巨头忧心忡忡。

在这样的背景下,寻找价格更为亲民、供应更具稳定性且能够满足自身 AI 运算需求的芯片,成为了众多科技巨头的当务之急。

而 ASIC 芯片的适时出现,恰好完美契合了这些需求。

回顾 ASIC 热潮的发展历程,去年 12 月无疑是一个关键的转折点。

彼时,作为 ASIC 领域极为重要的概念股,博通的股价强势上扬,从 180 美元一路飙升至 250 美元,市值一举突破万亿美元大关。

与之形成鲜明对比的是,英伟达的股价则一路下行,甚至跌破 130 美元。

诸如 Google 公司大名鼎鼎的 TPU(Tensor Processing Unit,张量处理单元),前几年风靡一时的比特币矿机,英特尔的 Gaudi 2 ASIC 芯片,IBM 的 AIU,AWS 的 Trainium 等,都属于 ASIC 芯片的范畴。

此外,近年来备受关注的 DPU(Data Processing Unit,数据处理单元)和 NPU(Neural Processing Unit,神经网络处理单元),同样也是 ASIC 芯片。

若要清晰了解 ASIC 与 GPU 各自具备哪些优势,我们可以对二者进行详细对比。

ASIC 专为特定 AI 算法定制,在执行特定任务时,其性能表现卓越。

以 Google 的 TPU 为例,它针对深度学习矩阵运算进行了深度优化,计算效率极高。

ASIC 的能效比十分出色,能够有效降低能耗成本,并且在大规模处理数据时,具备高吞吐量和低延迟的显著优势。

从成本角度来看,大规模使用时,其单位算力成本远低于 GPU。

例如,谷歌的 TPUv5、亚马逊的 Trainium2 单位算力成本仅为英伟达 H100 的 70% 和 60%。

不过,ASIC 也存在明显的局限性,其灵活性较差,功能相对固定,一旦算法发生改变,就需要重新进行设计,开发难度较大,并且软件生态较为单一。

反观 GPU,其通用性极强,能够应对多种不同类型的计算任务,在科学计算、游戏渲染等众多领域都有着广泛的应用。

GPU 的并行计算能力十分强大,非常适合处理复杂的神经网络模型。

同时,它拥有成熟且丰富的软件生态,借助 CUDA 等工具,开发者能够较为轻松地上手。

然而,GPU 在执行特定任务时的效率相较于 ASIC 有所逊色,功耗较高,这会增加能耗成本。

此外,高端 GPU 的价格高昂,如英伟达 H100 售价在 2.5 万至 3 万美元之间,获取难度较大,并且存在时延较高的问题。

GPU,会被淘汰吗?

那么,随着 ASIC 的兴起,GPU 是否会很快被淘汰呢?从行业资讯看来,这种情况短期内并不会发生。

综合多家第三方机构的统计数据可以发现,在当前的 GPU 市场中,英伟达占据了大约 90% 的份额。

AMD 虽然也在积极布局 GPU 产品领域,不断发布新的产品,但由于在软件生态建设方面尚不够完善,截至目前,其市场份额仅占个位数百分比。

凭借在性能、生态、集成能力等多方面的显著优势,英伟达的 GPU 在中短期内仍将是 AI 芯片的首选。

英伟达的软硬件网络整套方案已经相当成熟,其技术和资金实力极为雄厚,GPU 的存量和出货量依然庞大,在市场中的地位短期内难以被撼动。

尽管 ASIC 的崛起速度迅猛,但它仍需要一定的时间来走向成熟。

AI ASIC 芯片的研发过程充满了风险,即便研发成功,也需要时间让用户逐渐接受。这就意味着,在未来相当长的一段时间内,GPU 和 ASIC 将处于共存的状态。

用户会根据不同的应用场景,选择最适合自己的芯片。对于厂商而言,发展自研 ASIC,更多地是为了在与英伟达的谈判中争取更有利的价格。

AMD 首席执行官苏姿丰也曾就这一问题发表过自己的观点。

她表示:“目前,GPU 是大语言模型的首选架构,因为 GPU 在并行处理方面具有非常高的效率,但在可编程性方面存在一定的欠缺。五年多以后它还会是首选架构吗?我认为情况会发生变化。”

苏姿丰预计,在未来五年或七年的时间内,GPU 虽然不会失去其优势地位,但会有除 GPU 之外的新势力涌现。从目前的发展态势来看,ASIC 或许会是其中的最优选之一。

在未来一段时间内,ASIC 芯片将处于快速发展的阶段。摩根士丹利预计,AI ASIC 市场规模将从 2024 年的 120 亿美元增长至 2027 年的 300 亿美元,年复合增长率将达到 34%。

当然,除了 ASIC 之外,像 FPGA 等其他类型的 AI 芯片也有可能在未来崭露头角,共同推动未来 AI 芯片市场格局的变革。

GPU 虽然目前在 AI 领域占据着重要地位,但随着技术的持续革新,其面临的挑战日益严峻。

可以预见,未来的 AI 芯片架构领域将充满更多的变数与可能性,让我们拭目以待。

来源:慧算云

相关推荐