下一代全光互联!OCS光交换机--行业解析

B站影视 电影资讯 2025-09-21 22:30 1

摘要:传统三层架构:包括接入层、汇聚层和核心层,对应位置均采用电交换机,一台下层交换机会通过两条链路与两台上层交换机互连,实际承载流量的只有一条,其它上行链路,只用于备份,一定程度上造成了带宽的浪费,因此传统网络架构有网络带宽阻塞,上层带宽小于下层带宽。

一、当前网络架构和交换机痛点

1、数据中心网络架构设计

在IDC建设过程中,网络架构是重要部分,架构设计的好坏直接决定了数据中心数据转发效率和可靠性。

以前,IDC的网络规模不大,网络通过数十台设备简单互连就可。而现在,随着AI的发展,为满足各种应用,网络架构也需要及时调整。

当前IDC的网络架构,主要由大量的二层接入设备和少量的三层设备组成的网络结构。

传统三层架构:包括接入层、汇聚层和核心层,对应位置均采用电交换机,一台下层交换机会通过两条链路与两台上层交换机互连,实际承载流量的只有一条,其它上行链路,只用于备份,一定程度上造成了带宽的浪费,因此传统网络架构有网络带宽阻塞,上层带宽小于下层带宽。

但是,弊端也暴露出来了,如果一直采用传统三层架构,就会发现IDC内部的大范围数据转移,经常需要经过接入层、汇聚层、核心层、汇聚层、接入层,反复经过不同层级的交换机和路由器,给IDC的通信网络构成很大压力;而且数据中心网络中包含了多个子网,虚拟机每一次迁移可能都要在子网之间跳跃,导致 IP 地址发生变化。

叶脊拓扑结构:相比于传统网络的三层架构,叶脊网络进行了扁平化,变成了两层架构,叶交换机相当于传统三层架构中的接入交换机,脊交换机,相当于核心交换机,只需两个网络层级就能解决问题,所有的服务器都属于一个子网,大大减少了无用的数据传输,从而更加适应云时代的需求。

2、AI大模型时代的交换

AI 大模型时代来临,计算需求和数据交换不同于传统的架构。如今的 AI 模型,整体呈现模型架构收敛到基于 Transformer 的基础模型的趋势,而模型参数量有很大提升,给模型训练带来很大挑战。因此,有必要为这样一种基本统一而巨大的需求进一步优化网络架构。

大规模计算集群通常要做计算能力的扩展,分为两条路径:第一条是加强单个运算单元的性能,即 Scale up,纵向扩展,通过增加CPU核心数、内存容量、GPU数量等来增强系统能力;第二条是将更多的计算单元连接起来,即 Scale out,横向扩展,通过添加多个同构或异构的节点,将多台服务器组成集群,通过网络互联协同工作。

对 AI 网络而言,下层是 Scale up,其中的 GPU 和服务器进行极其紧密的连接,可以近似当做一台超级服务器,例如 NVIDIA 的 SuperPOD 或 GH200 超算;上层则是 Scale out,将多个 POD 连接起来以实现超大规模扩展。

3、Scale up和 Scale out 的交换痛点

Scale-up通过高密度集成GPU等算力芯片,追求单机柜内的高速互联。但铜缆在高速传输时有效距离极短(如448G速率下铜缆传输距离不足1米),限制了单机柜内GPU数量的扩展,并且,高密度GPU集成导致单机柜功耗大幅增加,可能达到1兆瓦以上。

而Scale out 网络中,无论是 IB 还是以太网,传输过程中均需要多次光电转换,带来性能损失。例如在 H100 千卡 IB 集群中,共 127 台服务器、32 台叶交换机、16 台脊交换机,数据从一台服务器发到另一台服务器经常需要经过 4 次光电转换和 4 次电光转换,总计 8次,降低了集群效率。

下图:DGX H100 SuperPOD 千卡集群配置方案

众所周知,光信号比电信号传输距离远,速度快,但现有技术不足以支持直接对光信号进行灵活的数据处理,所以,光信号必须转化成电信号才能处理。此时,电信号处理的其实就是地址,因为数据包从哪台服务器发往哪台服务器是不确定的,所以交换机或路由器必须打开数据包,查看开头的地址,才能决定如何转发。TCP、IP、以太网等每一层网络负责不同的功能以及不同层级的地址,这里与我们的接受快递非常相似。

现有的 AI 网络当中,交换机仍然需要打开数据包查看以太网地址等,还是需要光电转换。如果能够免去光电转换,网络效率将得以提高。

于是,基于以上痛点和需求,光交换机 OCS就此应运而生了。

二、OCS基础知识扫盲

1、概念&工作原理

OCS,全称Optical Circuit Switches,即光电路交换机,是一种基于纯光信号路径切换的核心技术设备,其核心在于无需光-电-光(O-E-O)转换即可实现光信号的路由与转发。

其工作原理是用一组平行反射镜来控制反射光的位置,随着平行反射镜旋转一定角度,反射光将会发生平移。

OCS从根本上解决了信号转换带来的延迟和能耗问题,信号转换效率理论上限达到传统电交换机的1000倍,而功耗仅为传统电交换机的1/10左右。这一技术对于电力成本占运营支出大头的超大规模IDC意义重大,已成为下一代数据中心网络的理想选择。下图所示:

光-电-光交换:

↓↓

全光交换:

下图:传统电子交换机叶脊架构与谷歌 OCS 网络架构

2、特点

(1)低延迟:光信号直接交换,并不解析数据包而只是反射光线,消除传统交换机的光电转换、数据包地址解析和缓存排队时延,从而实现接近 0 的延迟(几乎唯一的限制是单模光纤的容量/带宽)谷歌实测延迟降低50%以上。

(2)低能耗:无需高功耗DSP交换芯片,不需要放大器或中继器等功率密集型组件来进行长距离传输,单机架能耗降低40%;同时也不需要逐包解析数据包,OCS每比特的能耗可以比 EPS(电交换机)低几个数量级,,能耗差距可达 50 倍,契合绿色数据中心趋势。

(3)无阻塞带宽:支持400×400端口级联,单端口速率可达800G/1.6T,满足AI集群海量数据吞吐需求。

(4)拓扑重构能力:通过软件定义动态调整光路,适应大模型训练中节点通信模式的实时变化。

3、OCS 主流三种方案

(1)MEMS 方案

MEMS 方案通过在硅晶圆上蚀刻微型反射镜阵列,并利用集成的静电或磁致动器驱动微镜的倾斜,以精确地改变输入光束的传播方向,将其路由至指定的输出端口。

MEMS技术的核心是在硅基芯片上集成一个由成百上千个微米级可动反射镜构成的阵列,通过施加磁电、静电梳齿或热电驱动可精确控制每个微镜在二维(2D)或三维(3D)空间内进行微小角度的机械偏转。

在3D MEMS架构中,输入光纤阵列和输出光纤阵列相对排布,任意一束入射光可通过2面特定微镜的协同反射,被精确地导向任意一个目标输出端口。MEMS技术的核心优势在于出色的可扩展性,能够以相对经济的成本构建超大规模的光交换矩阵,但机械偏转导致光路切换时间较长,且机械活动部件对封装能力要求高。

MEMS技术是目前技术成熟度最高的全光交换技术路线,已在谷歌TPU集群、Apollo网络、美国光芯片龙头Lumentum中应用。

Lumentum 在其 R300 产品中使用了 MEMS 方案,其 MEMS 技术已累积超过 1 万亿小时的现场微镜运行时间,对于提升 OCS 的可靠性和性能有显著作用。

为了打破英伟达在CPO的垄断优势,谷歌从TPU v2版本开始构建超级计算机集群,并在TPU v4 Pod 超级计算机首次引入OCS,一个集群总共有4096个TPU芯片,与 48 个 OCS 链接,专为大规模机器学习工作设计。

下图:TPU v4集群:OCS光交换机内MEMS阵列

谷歌在 OFC2023 中展示的内部项目的“Apollo”OCS 平台基于 MEMS 方案,对于该系统,OCS 降低了 30%的成本和 40%的功耗,能够合理地控制成本。谷歌在脊置换与 AI 集群重构等实际场景中,充分展示了该技术在节能与架构灵活性方面的显著优势,有效推动了市场对该技术前景的关注。

2024 年谷歌已开始量产最新的第六代 TPU v6,使用自主研发的 OCS 取代了脊交换机,通过其擅长的软硬件集成,提高了计算集群效率,大大降低了 TPU SuperPOD 的功耗和成本。

(2) 数字液晶(DLC)方案

数字液晶(Digital Liquid-Crystal,DLC)是一种非机械的光学交换方案,其核心原理是利用液晶分子在外部电场作用下的偏转特性,实现对光束传播方向的精确控制。在数字液晶光交换系统中,液晶光模块(LCLM)通过级联可调液晶延迟器与双折射晶体光楔,实现对多端口光信号的灵活调度。该技术对光学装调工艺要求较高,目前最大可支持512端口规模。

与MEMS等技术相比,数字液晶光交换在可靠性和使用寿命方面表现较好,所需驱动电压低,但其光路切换时间通常为几百毫秒,长于MEMS方案,主要应用在无需频繁数据切换的场景,如冗余备份。

由美国激光公司Coherent 主导开发,该公司于 18 年前就已经将该项技术用于波长选择开关(WSS)中,具有丰富的技术使用经验,同时 DLC 技术只需要极低的驱动电压(低于 10V)来切换其液晶单元,能够进一步保障 OCS 运行的可靠性,适用于特定波长范围内的精确控制。

(3)直接光束偏转(DLBS)方案

DLBS,全称Direct Light Beam-Steering,直接光束偏转核心由三个部件构成:光纤准直器(fiber collimator)、二维压电致动器(2D Piezo Actuator)和精确位置传感器(position sensor)。

每个准直器端口的转动位置均经过预先精确标定。系统通过压电效应驱动致动器产生二维伸缩位移,从而实现准直器的精密转动,并借助位置传感器实现闭环反馈控制,最终将两个光纤准直器精准对准至同一直线上。

压电驱动的OCS技术优于MEMS技术和数字液晶方案,且理论可扩展的端口数量多,但由于压电驱动的OCS系统的每一输入/输出端口都是一个小型的可进行2D方位调整的光束控制系统,组装复杂性随着端口数的增加而线性增长,导致系统成本较高,单台成本超过20万美元。

该技术是 Polatis 的独家专利技术,响应速度快且损耗低,时延约几毫秒,能够帮助 OCS 中的光精确转动与定位,不对光信号做任何其他处理,光性能良好。主要适用于军工、科研等极端高性能场景。

下图:Polatis 单模 576 x 576 矩阵光开关

三、产业链&细分标的

(一)产业链

OCS产业链覆盖上游:光芯片、光学元器件/组件;中游:光交换机整机;下游:数据中心互联/AI算力集群三大环节。

1、上游光学技术

(1)光模块与光器件技术:涉及光环形器、双向WDM器件等,用于实现光信号的转换、传输和处理。

(2)光芯片与组件技术:包括激光器芯片等高端光芯片,是OCS实现高速、低功耗光信号处理的关键。

(3)MEMS技术:MEMS振镜是OCS的核心部件之一,通过静电驱动等技术实现镜面偏转,完成光路切换,可实现光信号的精确控制和切换。

(4)硅光技术:硅光集成技术可将多种光学功能集成在硅基芯片上,降低OCS的成本和尺寸,提高集成度和性能。

2、中游整体环节

(1)光交换机整机制造技术:包括光学技术(如硅光)、光子路由引擎技术等,需将各种光学元件和模块进行系统集成,实现光信号的高速、低延迟交换。

(2)组装代工:具备纳米级光学耦合技术等,确保光器件和模块的高精度制造和组装,满足OCS的高性能要求。

3、下游应用

(1)数据中心互联(DCI)技术:OCS用于数据中心之间的高速互联,可简化光纤拓扑,实现GB级别带宽的传输,满足数据中心之间大量数据传输的需求。

(2)AI算力集群技术:OCS可降低AI算力集群中GPU间的通信延迟,提高算力密度和训练效率,如谷歌在其TPU集群中应用OCS技术,提升了系统性能和能效。

(3)通信网络技术:在通信网络中,OCS可用于骨干网、量子通信等领域,如在量子通信中,OCS技术可提高密钥的成码率。

(二)细分标的:

以下为不完全列举:

(1)OCS 核心零部件

① 腾景科技:掌握精密光学组件和光引擎核心元件,已量产的钒酸钇(YVO4)单晶适用于隔离器,环形器和偏振器件,能够实现双向通信的元件,可以使单个光纤股同时进行双向传输。为Coherent(谷歌OCS独供)提供纳米级光学元件。

② 赛微电子:全球MEMS阵列代工龙头,全球MEMS-OCS技术领先者,量产进度领跑行业。

③ 炬光科技:全球领先的光子应用解决方案提供商,其研发的精密光学微透镜阵列为 OCS 小型化奠定技术基础,已通过Calient间接供货谷歌/Meta。

④ 光库科技:OCS技术MEMS路线代表,作为谷歌OCS的重要供应商和代工厂商,供应光开关核心器件,在高速光交换领域技术积累深厚。

⑤ 凌云光:OCS压电陶瓷路线代表,自研OCS交换机技术路线(光束偏转)差异化,参与OCS整机研发产品性能对标国际龙头,适配国内AI算力中心需求。

⑥ 光迅科技:光电子器件龙头企业,为OCS提供核心光引擎与光模块,国内唯一实现MEMS-OCS量产的厂商。

(2)光纤及连接器

① 长飞光纤:连续8年全球光纤光缆销量第一,市场份额超20%,是国内三大运营商的核心供应商,OCS光纤及连接器供应商。

② 长芯博创:OCS“高速光纤连接器”龙头,专注光通信连接解决方案,产品性能优异,在光器件封装领域具有领先地位。

③ 天孚通信:OCS 里的光纤准直器、透镜等核心部件,这家光纤连接龙头都有布局。其精密陶瓷工艺全球领先。

④ 亨通光电:提供OCS相关光纤光缆及光器件,是全球光纤通信前三,在海洋通信与智能电网领域布局领先。

⑤ 中天科技:国内光纤光缆双巨头之一,全产业链覆盖光纤预制棒、光纤、光缆、光模块等环节,涉及OCS配套光纤及光组件,在特高压与海洋工程领域优势突出。

⑥ 烽火通信:光通信领域的龙头企业,尤其在光纤光缆、光传输设备等领域具有显著优势。在 OCS 交换机设备研发制造方面成果显著。

⑦ 太辰光:全球光密集连接产品龙头,供应OCS相关光连接器及器件,专注光通信无源器件,产品品质优良,市场覆盖全球多个地区。

(3)OCS 整机与集成

① 中际旭创:OCS数字液晶路线代表,布局OCS整机及核心技术,通过提供高性能的800G 乃至 1.6T 的光模块解决方案,以支持 OCS 架构的高速数据传输需求。

② 德科立:业内领先的光电子器件和光传输子系统供应商,是 OCS 整机供应商及代工商,产品包括光收发模块、光放大器、光传输子系统等。

③ 锐捷网络:中国200G/400G数据中心交换机市场占有率长期位居第一,国内白盒交换机龙头,与英伟达合作开发CPO交换机。

来源:全产业链研究一点号

相关推荐