摘要:以ChatGPT为代表,从对话聊天到生成图片,愈来愈多的大模型正在深入至普通人的生活之中,而驱动这些大模型的数据中心也在迅速发展,更庞大的规模,更强大的算力,让科技巨头们展开了一场轰轰烈烈的军备竞赛。
以ChatGPT为代表,从对话聊天到生成图片,愈来愈多的大模型正在深入至普通人的生活之中,而驱动这些大模型的数据中心也在迅速发展,更庞大的规模,更强大的算力,让科技巨头们展开了一场轰轰烈烈的军备竞赛。
与之对应的是,如今数据中心对更快、更高效的通信网络需求比以往任何时候都要迫切。随着数据生成和处理量的持续飙升,传统的电子互连技术(如铜缆以太网)已经达到了极限。而传统光学系统(使用基础激光器和光电探测器)也无法满足现代数据中心所需的数据速率。
硅光应运而生,硅光子集成电路(PIC)将光学的优势与集成电路的可扩展性相结合,这一微型器件将多种光子功能集成到单一芯片上,实现了以光速进行快速数据传输。与依赖电子的传统技术不同,PIC使用光子来传递信息。
基于PIC的数据中心(数据通信)收发器是紧凑型设备,集成了发射器和接收器功能,支持通过光纤的双向通信,其通过波分复用(WDM)实现了并行数据传输,这种并行性大幅提升了每根光纤的总吞吐量,同时节省了宝贵的面板密度并减少数据中心所需的光纤电缆数量。
随着AI和机器学习成为数据中心运营的核心,PIC的作用愈发重要,AI模型的训练需要海量数据,而PIC则是最佳的联系纽带,在可预见的未来,每个AI加速器可能平均需要两个光学收发器,这也意味着一个庞大的市场正在形成。
Yole报告显示,2023 年PIC市场价值 9500 万美元,预计到 2029 年将增长至 8.63 亿美元以上,复合年增长率为 45%,这一增长主要由高数据速率的可插拔模块驱动,这些模块增加了光纤网络容量。此外,快速增长的训练数据集规模表明,数据将在机器学习(ML)服务器中利用光学I/O扩展ML模型,从而进一步推动市场的增长。
硅光子产业格局正在围绕多样化的参与者逐步形成,众多初创企业正在推动硅光子技术的发展,目标集中在高速收发器、光互连和激光雷达等特定领域,晶圆厂通过提供制造、工艺开发和商业化生产能力,为公司扩大硅光子在多种应用中的规模化提供了必要支持。设备供应商则扮演着重要角色,提供生产高性能光子器件所需的精密工具。
新的市场,就是新的机遇,不同的半导体厂商,早已聚焦于硅光。
传统巨头
英特尔无疑是巨头当中最先开始研究硅光的一家厂商,其在硅光子技术方面的研发已有 30 多年的历史,据英特尔称,自 2016 年推出硅光子平台以来,英特尔已出货超过 800 万个PIC和超过 320 万个集成片上激光器,这些产品已被众多大型云服务提供商采用。
英特尔所推出的硅光技术,主要是通过 CMOS 制造工艺,将激光器、调制器、探测器等光学器件与电路集成在同一硅基片上,实现电子与光学的高效结合,其支持波分复用(WDM)技术,可以在单条光纤上同时传输多种波长的光信号,同时还具备高效的光电转换技术,使得硅光模块可以在数据中心等场景中提供高性能的互连。
此前英特尔所推出的 100G 和 400G 硅光模块已大规模商用,其正在与云计算巨头、网络设备商合作,从而推动硅光技术标准化和普及。
值得关注的是,今年6月的光纤通信大会 (OFC) 上,英特尔推出了业界首款全集成光计算互连 (OCI) 芯片组。这款与英特尔 CPU 共同封装的芯片组在运行实时数据时进行了演示,标志着高带宽互连技术取得了重大进展。
英特尔称,这一进展将 CPU 和 GPU 中的电气 I/O 替换为光学 I/O 来传输数据,就像从使用容量和范围有限的马车运送货物,转变为使用能够在更长距离上运送大量货物的汽车和卡车。
完全集成的 OCI 芯片组利用英特尔的硅光技术,将包含片上激光器和光放大器的硅光集成电路 (PIC) 与电子 IC 集成在一起。英特尔表示,在 OFC 上展示的 OCI 芯片组与英特尔 CPU 共同封装,但也可以与下一代 CPU、GPU、IPU 和其他片上系统 (SoC) 集成。
这是首个 OCI 实现,支持高达 4 兆兆位/秒 (Tbps) 的双向数据传输,与外围组件互连高速 (PCIe) Gen5 兼容。实时光链路演示利用单模光纤 (SMF) 跳线在两个 CPU 平台之间建立发射器 (Tx) 和接收器 (Rx) 连接。CPU 生成并测量了光误码率 (BER),演示显示了单根光纤上 8 个波长以 200 千兆赫 (GHz) 间隔的 Tx 光谱,以及 32 Gbps Tx 眼图,显示了强大的信号质量。
该芯片支持每个方向 64 个 32 Gbps 数据通道,传输距离最远 100 米,利用八对光纤,每对承载八个密集波分复用 (DWDM) 波长。英特尔表示,这种一体式封装解决方案非常节能,每比特仅消耗 5 皮焦耳 (pJ) 的能源,而可插拔光收发器模块的能耗约为每比特 15 皮焦耳 (pJ)。
英特尔称,它正在实施一种新的硅光子晶圆厂工艺节点,该节点具有先进的设备性能、更高的密度、更好的耦合和更好的经济性。该公司表示:“英特尔继续在片上激光器和 SOA 性能、成本(芯片面积减少 40% 以上)和功率(减少 15% 以上)方面取得进步。”
不过截至目前,英特尔的 OCI 芯片组还处于原型阶段,其正在与部分客户合作,将 OCI 与他们的 SOC 一起封装,形成光学 I/O 解决方案。
与英特尔相比,其他老牌半导体巨头尽管落后了半拍,但在意识到硅光在数据中心之中的必不可少的作用后,也开始纷纷布局这一领域。
博通可能是除了英特尔之外走得最早最远的厂商之一,去年3月,博通推出了其首款集成硅光网络产品,代号为 Bailly。Bailly 将光纤连接与博通的下一代 Tomahawk 5 交换机集成在一起,提供每秒 51.2 兆兆位的数据吞吐量,与之前的产品 Humboldt 相比,其交换性能提高了一倍,该公司表示,这是世界上第一款功能齐全的同封装光学开关,这一产品最终在今年向客户正式交付。
与英特尔的硅光技术相比,博通更专注于数据中心、云计算和电信领域的光模块和光器件的商业化和性能优化,博通同样利用 CMOS 工艺在硅基片上制造光学元件,如光调制器、光检测器和光纤耦合器,其优势在于提供了端到端解决方案,不仅提供硅光模块,还通过其芯片组(如交换芯片、PHY 芯片等)实现端到端的高速互连,从而优化系统性能。
今年,博通还在Hot Chips大会上展示了硅光最新进展,,其展示的的“光学引擎”可提供 1.6 TB/秒的总互连带宽,相当于每个方向 6.4 Tbit/秒或 800 GB/秒。而在8月还有报道指出,博通正在开发新的硅光技术,旨在大幅提高 GPU 和其他 AI 加速器的可用带宽。其通过利用共封装光学器件(CPO),将光学连接组件直接集成到 GPU 中,从而实现更高的数据速率,同时降低功率要求。
博通的老对手Marvell在硅光方面的布局甚至更早一些。早在2021年时,Marvell的技术文章就提到了硅光技术的未来应用,2022年3月,Marvell宣布其用于数据中心的 400G DR4 硅光子平台解决方案已投入生产。据了解,其推出的400G DR4 硅光子平台可降低每比特成本、加快上市时间,并为云优化电光解决方案的更高集成度铺平道路。
值得一提的是,Marvell 采用异质集成方法,将硅基光电子技术与硅锗(SiGe)放大器和 III-V 族材料激光器相结合,提升系统性能。这种多元化技术融合使得每个组件都能选择最适合的技术,克服单一技术的局限性。
而在今年3月,Marvell 展示业界首款 200G 3D 硅光引擎其具有 32 个通道的 200G 电气和光学接口,可以多 TB 的速度连接下一代 AI 集群和云数据中心。其表示,Marvell 3D SiPho 引擎将波导和调制器、光电探测器、调制器驱动器、跨阻放大器、微控制器和大量其他无源元件等数百个组件整合到一个统一的设备中,从而大幅提升光学互连的性能、带宽和能效。与具有 100 Gbps 电气和光学接口的同类设备相比,200 Gbps 设备可提供 2 倍的带宽、2 倍的输入/输出 (I/O) 带宽密度,并且每比特功耗降低 30% 。
三星在硅光市场也不甘落后。今年6月的报道指出,三星的代工部门正在加紧开发名为“I-CubeSo”和“I-CubeEo”的先进硅光子学工艺,三星晶圆代工部门总裁指出,硅光子技术可最大限度发挥芯片性能,在数据中心等需要高速传输的领域,可减少信号损失,解决散热问题,预计三星将在2027年完成硅光子技术。
AMD起步较晚,但它也开始了自己硅光技术研究。今年9月的报道称,AMD正在台湾寻找硅光子学合作伙伴,其已与台湾新秀硅晶圆厂北研半导体和北研磊晶制造公司接洽,前者专注于硅光子平台的设计研发,后者则拥有MOCVD机台,可生产4英寸和6英寸磊晶晶圆。
最后是炙手可热的英伟达,今年12月,在美国举行的全球领先半导体会议 IEDM 2024 上,英伟达积极预测了硅光子学的未来,同时展示了其 AI GPU 技术。其表示,“从中长期角度来看,硅光子学预计将有助于 AI 数据中心内的芯片到芯片连接。”
会议期间,英伟达还展示了与台积电合作开发的硅光子原型,表明两家公司在下一代 AI 半导体技术方面建立了牢固的合作伙伴关系。
新锐企业
有意思的一点是,尽管上述的几家巨头纷纷进军硅光,但它们并非从头开始研发,仔细研究就能发现,为了尽可能快地缩短应用落地的时间,它们都借助了几家规模较小的新锐企业的力量。
Lightmatter作为硅光子学的先行者,完成了 4 亿美元的 D 轮融资,Celestial AI在三轮融资中筹集了 3.389 亿美元,Ayar Labs在三轮融资中筹集了 2.197 亿美元,这三家新锐企业在硅光颇受瞩目的当下,获得了最多的红利。
分别来说说这三家企业吧。
成立于 2017 年的Lightmatter专注于利用光子计算技术优化人工智能模型的性能。其核心理念是通过光子计算替代传统的电子计算,从而解决AI计算中功耗高、延迟大的问题。
Lightmatter 的核心技术基于光子芯片,其旗舰产品 Envise 是一款采用光子计算的AI推理加速器。通过利用光子学原理,Envise 可以在模型推理过程中显著降低功耗,同时提供更高的计算吞吐量。其创新之处在于光子计算的并行能力,能够在处理矩阵乘法时展现出无与伦比的效率。
Lightmatter 的技术主要面向数据中心和高性能计算领域。通过光子计算技术,Envise 加速器被认为能够在未来显著降低AI计算的能源消耗,为可持续计算提供新的路径。
近期Lightmatter 正积极扩展其技术生态,与包括谷歌和微软在内的技术巨头建立了合作伙伴关系。其技术路线图还包括将光子计算技术进一步应用于通用处理器中。
总部位于加利福尼亚州圣克拉拉的Celestial AI ,专注于开发基于光波导和光子集成电路(PIC)的高性能芯片互连解决方案。其目标是通过创新的光通信技术解决数据中心中AI芯片和芯粒(Chiplet)的互连瓶颈。
Celestial AI 的核心技术包括一种独特的光波导技术,能够将信号分布到芯粒光栅耦合器,同时保持低功耗和低热量输出。这一技术基于硅光子学,采用电吸收调制器(EAM)和嵌入式光电二极管,实现高速、低功耗的数据传输。
值得一提的是,此前Celestial AI宣布从早期先驱 Rockley Photonics 收购硅光子知识产权,包括全球已颁发和正在申请的专利,使其全球总 IP 组合达到 200 多项专利。收购的专利组合包括三大技术类别,包括光电系统级封装、电吸收调制器 (EAM) 和光开关技术,与多种 AI 数据中心基础设施应用相关。此次收购的 IP 与 Celestial AI 的核心技术路线图直接契合,并增强了该公司 Photonic Fabric 技术平台的部署和商业化战略。
就目前而言,Celestial AI 的技术应用主要集中在超大规模数据中心、高性能计算以及内存子系统中。其创新设计能够在HBM(高带宽存储)与处理器之间实现高效互连,为生成式AI和大规模模型的训练提供支持。
得益于 imec.xpand 创新基金以及多家美国基金的支持,Celestial AI 正在迅速扩大其技术应用范围,并锁定未来两年光子产能的主要部分。其产品已经进入量产阶段,并计划通过IPO进一步拓展市场。
成立于 2015 年Ayar Labs 的总部同样位于加利福尼亚州,其专注于通过光电融合技术解决传统电子互连的带宽和功耗瓶颈,主要目标是通过光学 I/O 技术取代传统的电子 I/O,从而显著提升数据传输的效率。
据了解,Ayar Labs 的核心技术基于光电混合架构,其主打产品 TeraPHY 是一款支持多通道光通信的芯片,能够提供高达 Tb/s 的数据带宽。其技术优势包括:使用微环调制器(Micro-Ring Modulator),实现高效的光信号生成和调制,光学 I/O 技术支持大规模芯片互连,同时大幅降低数据中心的能耗和热耗,以及开放式设计允许客户根据需求定制其光电系统。
目前,Ayar Labs 的技术主要应用于数据中心、高性能计算以及通信网络中。其光学 I/O 技术被认为是未来推动数据中心性能提升的关键驱动力之一,其已与英特尔和英伟达等主要厂商建立了合作关系,并获得了来自业界领先投资者的支持。
晶圆代工
不论是上述的科技巨头,还是新锐企业,除了三星和英特尔之外,它们最终都需要一家晶圆代工厂来将最终的硅光产品生产出来,而半导体晶圆代工巨头们,显然也看到了这一趋势。
新技术让代工业务排名全球第七的 Tower Semiconductor(高塔半导体)相对于同样进入光子学业务的台积电等更大的竞争对手更具竞争优势。分析师表示,这家以色列芯片代工厂在生产可加快数据传输速度和节省电力的硅光子学和硅锗方面领先于竞争对手。
Tower 预计今年硅光子业务收入将增长一倍以上,达到约 1 亿美元。Tower Semiconductor总裁 Marco Racanelli在接受媒体采访时表示,该公司抓住了支持人工智能热潮的芯片需求浪潮,明年硅光子业务很可能再翻一番。他补充说,这项业务将在一两年内增长至占公司总收入的 10% 左右。
目前,Tower已经与多家客户达成合作,据Craig-Hallum的分析师Richard Shannon称,Tower拥有超过50家硅光子客户,其中包括全球11家数据通信收发器制造商中的7家。该分析师指出:“Tower Semiconductor在可插拔领域占据主导地位,因为其工艺高度可定制,能够根据客户需求提供其他公司无法实现的解决方案。”
今年11月,Tower宣布推出全新300mm 硅光子 (SiPho) 工艺标准代工产品。这一工艺是对 Tower 成熟的 200mm (PH18) 平台的补充,该平台目前已量产,可为客户提供先进的解决方案,以满足下一代数据通信应用对高速数据通信日益增长的需求。此外,其还已开始为多家主要客户量产基于其最新硅光子 (SiPho) 平台的 1.6Tbps 硅光子产品。
Tower 的大容量硅光平台可提供高数据传输速率光收发器所需的各项关键功能,包括高带宽光调制器以及从激光器到光纤的低损耗边缘耦合。这些功能在高速数据通信组件的开发中至关重要,对于实现将传输速率从每通道 100Gbs 提高到 200Gbs 及以上发挥了关键作用。
所有数据通信光收发器都需要跨阻放大器 (TIA) 和驱动器,在该领域,Tower也是市场领导者,份额超过 50%。
GlobalFoundries(格芯)同样也对硅光市场寄予厚望。
GlobalFoundries表示,其所推出的硅光子平台GF Fotonix 是一个单片平台,将 300 毫米光子学功能和 300GHz 级 RF-CMOS 集成在一块硅片上。除了光子和电子特性外,该技术还包括 2D/2.5D 集成功能(如铜柱和铜接收垫)和“光进光出”功能——基于 V 型槽的光纤耦合器,具有片上 InP 激光连接功能。
目前,GF计划继续改进 GF Fotonix 平台,以更好地服务于当前的 AI/ML 市场。在未来几年内,他们希望将芯片的带宽从每波长 100 Gb (G/λ) 提高到 200 G/λ,最终达到 400 G/λ 及以上。他们还将致力于提高光纤互连的前沿密度,以及异质集成各种材料,包括磷化铟 (InP) 和钛酸钡 (BTO)。同时,他们正在尝试使用可拆卸和插座式光学接口来增强互连的可修复性。
台积电相较于Tower和GF,对硅光技术投入较晚,直到今年的北美技术研讨会上,台积电才概述了其解决方案,该方案目标是改善封装内连接,带宽达到 12.8 Tbps。台积电业务开发副总裁 Kevin Zhang 表示:“随着我们将更多的计算能力带入大规模封装,数据传输成为一项挑战,但我们发现自己经常受到 I/O 供应商的限制。”“在台积电,我们花了很多年时间研究硅光子学。我们有能力将硅光子学带到交换元件附近,以创建非常节能的高速信号,以满足未来的计算需求。”
台积电的硅光子技术依赖于紧凑型通用光子引擎 (COUPE),该引擎采用该公司的 SoIC-X 封装技术,将 65nm 电子集成电路 (EIC) 与光子集成电路 (PIC) 结合在一起。台积电声称其 SoIC-X 互连具有非常低的阻抗,这意味着 COUPE 在功耗方面非常高效。
COUPE 的发展轨迹分为三个主要阶段。台积电的首款硅光产品是 OSFP 连接器(八进制小型可插拔连接器)的光学引擎,其数据传输速率为 1.6 Tbps,是目前顶级铜缆以太网解决方案最高速率的两倍。这一初始迭代不仅承诺提供卓越的带宽,而且还能提高能效,解决了现代数据中心的两个关键问题。COUPE 的后续几代产品旨在进一步突破界限。
第二代硅光将 COUPE 集成到 CoWoS 封装(硅晶圆芯片)中,并将光学器件与交换机一起封装。这将实现速度高达 6.4 Tbps 的主板级光学互连。台积电第三代产品的目标是传输速率高达 12.8 Tbps,旨在集成到处理器封装中。这一迭代仍处于探索阶段,尚无明确的发布时间表。台积电表示,正在考虑进一步降低功耗和延迟。
写在最后
随着数据中心对带宽和能效需求的持续飙升,硅光技术已经从一种前沿实验转变为行业不可或缺的解决方案。在传统巨头、新锐企业和代工厂的三方驱动下,硅光技术的潜力正被迅速释放。
展望未来,我们将见证这一技术更好地融入到AI数据中心之中,硅光或许目前还面临成本和技术瓶颈,但在全球数字化浪潮的推动下,它已经成为解决未来挑战的关键之一,下一个技术拐点,或许已近在咫尺。”
来源:智慧芯片一点号