我们进入了定制芯片时代?

B站影视 2025-01-22 09:35 2

摘要:全球对人工智能服务的需求正在激增。不幸的是,以经济和可持续的方式提供这些服务的挑战也同样巨大。人工智能电力需求预计每年将增长 44.7%,这一激增将使数据中心的电力消耗在 2028 年翻一番,达到 857 太瓦时:作为一个当今的国家,这将使数据中心成为仅次于日

人工智能即将面临一些严重的成长烦恼。

全球对人工智能服务的需求正在激增。不幸的是,以经济和可持续的方式提供这些服务的挑战也同样巨大。人工智能电力需求预计每年将增长 44.7%,这一激增将使数据中心的电力消耗在 2028 年翻一番,达到 857 太瓦时:作为一个当今的国家,这将使数据中心成为仅次于日本的第六大电力消耗国。这种不平衡威胁着过去 50 年来推动技术每一项主要趋势的“更小、更便宜、更快”的口号。

这也不一定会发生。定制硅片(针对特定用例进行优化的独特硅片)已经展示了我们如何在摩尔定律逐渐成为历史时继续提高性能,同时降低功耗。到 2028 年,定制芯片可能占 AI 加速器 (XPU) 的 25%(Marvell 估计),而这只是定制芯片的一种。

黄仁勋对人工智能工厂的愿景非常贴切。这些即将建成的人工智能数据中心将以无情的速度运转,全天候不间断。而且,与制造工厂一样,服务提供商的最终成败将取决于卓越运营,这是统治制造业的两个词。我们每单位代币消耗的能量比竞争对手多还是少?为什么平均故障时间在增加?当前的运营设备效率 (OEE) 是多少?在石油和化工行业,销售给客户的最终产品是难以区分的商品。它们的不同之处在于流程设计,因为它们利用不同的技术组合来榨取边际收益。

同样的情况也将发生在人工智能领域。未来,多样性将占据主导地位,成本最低、停机时间最少、能够推出新的差异化服务和应用的运营商将成为企业和消费者的最爱。

简而言之,最好的基础设施将会获胜。

定制芯片概念

实现差异化的主要方法之一是通过定制半导体实现定制硅片——即包含独特 IP 或功能,可实现应用程序的卓越性能的芯片。它的范围从基于独特、单一设计构建的 AI 加速器到包含额外定制 IP、内核和固件以针对特定软件环境进行优化的商用芯片。虽然现在的重点主要放在 AI 加速器等高价值芯片上,但每款芯片都将进行定制:例如,Meta 最近推出了一款定制网络接口控制器(NIC),这是一种相对默默无闻的芯片,可将服务器连接到网络,以减少停机的影响。

单层高带宽内存 (HBM) 可能需要一个具有 2,048 个引脚的接口来传输数据,或者每个 XPU 需要超过 8,000 个引脚。定制可以大大降低功耗、引脚数量并增加内存容量。带有定制 HBM 的 XPU 预计将在一到两年内问世。

定制化将涉及重新思考半导体设计的各个方面。例如,有些公司正在寻找优化基础芯片和接口的方法,以管理用作高端 AI 加速器缓存的 GB 高带宽内存 (HBM)。优化可以将芯片封装内的内存增加高达 33%,将接口功耗降低 70%,并将可用于逻辑功能的硅片空间增加近 25%(Marvell 估计)。

定制类别还包括新兴的互连芯片类别,旨在扩大计算系统的规模和功能。如今,服务器通常包含八个或更少的 XPU 和/或 CPU,所有组件都安装在滑入机架的铝制盒子中。未来,AI 系统将包含数百个加速器以及分布在多个机架上的存储和内存,这些机架与一系列光学引擎相连,这些引擎根据 XPU、CXL 控制器、PCIe 重定时器、收发光学数字信号处理器 (DSP) 和其他设备的规格量身定制。

其中许多设备几年前甚至还不存在,但预计会迅速增长:根据 650 Group 的数据, 75% 的 AI 和云服务器可能在两年内包含 PCIe 重定时器。虽然这些设备和服务器将以技术标准为基础,但架构和设计在不同云之间会有很大差异。

半导体元素周期表

但是,如何制造定制半导体呢?设计一个生产 3nm 或 2nm 芯片的平台可能要花费 5 亿美元?在一个大型语言模型(LLM) 每隔几个月就会发生变化的市场中?这些技术将如何与冷板或沉浸式冷却等新兴理念相结合?

听起来很简单,其实一切都从基本成分开始。串行器-反序列器 (SerDes) 电路是教科书上您从未听说过的“世界上最重要的技术”。这些组件控制芯片和基础设施设备(如交换机和服务器)之间的数据流。例如,800G 光模块由八个 100G SerDes 构建。单个数据中心机架将包含数万个 SerDes。您可以将它们视为网络的分子:对整个系统健康具有巨大影响的基本构建块。稍微减少通过 SerDes 传输比特所消耗的皮焦耳可以转化为全球基础设施的大量节能。

同样,芯片封装现在在芯片设计中扮演着非常重要的角色,因为它提供了一种简化电力输送和数据路径的机制,同时继续提高计算性能。芯片中超过 50% 的电力可能被消耗在芯片内部不同子系统之间移动数据上。

芯片产业2.0?

随着定制成为常态,我们还将面临一个新的难题:一家公司如何提供定制产品,同时仍然利用大规模生产的优势?迄今为止,半导体制造商通过大量生产少量设备取得了成功。“定制”过去意味着采取相当简单的操作,如调整速度或缓存大小,类似于零售商可能会提供几种新颜色的同款基本款毛衣。

第一步——我们已经看到了——将在开发定制半导体所涉及的服务有更好的定义时到来。有些公司可能会主要专注于芯片设计和 IP。另一方面,你会看到公司提供采购和制造服务。还有一些公司可能专注于特定的设备和类别。只有少数几家公司会提供全套服务。人工智能本身也将发挥作用,将设计任务所需的时间和成本从几个月缩短到几分钟。这反过来又会为更多的客户和更多的芯片类别打开大门。

这个行业会成功吗?当然会。这不是我们第一次被要求完成不可能的任务。

专注半导体领域更多原创内容

关注全球半导体产业动向与趋势

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第4014期内容,欢迎关注。

来源:非chang娱乐

相关推荐