摘要:“带宽饥渴”四个字,已经不足以形容今天的数据中心。A100 到 H100 的算力翻 4 倍,背后的数据洪流却翻了 10 倍;GPT-4 训练一次就要跑 2.4 万块 GPU,相当于把全北京的摄像头同时直播 30 天。光电转换环节一旦掉链子,再贵的算力卡也只能“
“带宽饥渴”四个字,已经不足以形容今天的数据中心。A100 到 H100 的算力翻 4 倍,背后的数据洪流却翻了 10 倍;GPT-4 训练一次就要跑 2.4 万块 GPU,相当于把全北京的摄像头同时直播 30 天。光电转换环节一旦掉链子,再贵的算力卡也只能“空转”。于是,老牌“外挂”传统光模块和 2024 最火“原生”CPO(Co-packaged Optics)被反复拎出来对比——它俩到底差在哪?能不能一步到位“上 CPO”?
先拆定义:一个是“U 盘”,一个是“SoC”
传统光模块:把激光器、Driver、TIA、DSP 塞进一个金属小盒子,通过金手指插在交换机前面,像给电脑插 U 盘,即插即换。
CPO:把光器件直接“长”在交换芯片的封装基板上,电信号一出门就撞见光波导,像手机 SoC 集成基带,再也分不开。
前者是“外挂”,后者是“原生”。
拆性能:五组硬指标,差距肉眼可见
1. 信号路径
传统模块:芯片→PKG→PCB→连接器→模块→光纤,全程 10 cm+,每厘米 0.5 dB 损耗,800G 信号还没出机框就衰减 6 dB。
CPO:芯片→2 mm 硅光波导→光纤,损耗
2. 功耗
800G DR8 传统模块:实测 17.8 W,其中 40% 花在驱动+CDR+散热片。
CPO:同样 800G,把 Driver 做到 3 nm 制程,紧靠交换芯片,实测 10.4 W,再和主芯片共用散热器,机房 PUE 直接降 0.08。
3. 速率天花板
传统:QSFP-DD 8×100G 已量产,OSFP-XD 16×100G 在实验室,但信号完整性把速度锁在 1.6 T。
CPO:硅光+共封装,32×200G 已跑通 3.2 T,台积电 COUPE 路线图指向 6.4 T,只等 112 GBaud 激光器成熟。
4. 端口密度
1U 交换机面板:放 32 个 QSFP-DD 已是极限,对应 25.6 T。
CPO:光器件让出面板,同尺寸做到 51.2 T 交换芯片,64 个 800G 端口轻松塞进 1U,机房“机柜亩产”翻倍。
5. 成本&可维护
传统:100G 模块 300 元,800G 模块 4500 元,坏了拔下来 30 秒换完,运维小哥最爱。
CPO:800G 时代单价 1.2 万元,且“换光”=“换板”,一次故障就要下电拆整机,OPEX 翻 3 倍;不过 2026 年台积电把硅光 wafer 成本压到 300 美元/片,价格有望腰斩。
拆场景:谁才是“对号入座”的良配?
传统光模块——“六边形战士”
• 数据中心 Leaf-Spine:10G~400G 主力,拼的是性价比。
• 运营商 DCI:80 km 相干 ZR 模块,插拔式维修让野外施工成本最低。
• 企业/工厂:温湿度极限、电磁干扰,独立金属壳体抗造。
CPO——“特种兵”
• AI 超算集群:H100 到 B100 之间,单端口 800G,延迟每降 1 ns,就能多跑 512 张卡同步梯度,省下的电费用一年回本。
• 51.2 T 交换机:Broadcom Tomahawk5 配 64×800G,只有 CPO 能把 64 个激光器塞进 4000 mm² 封装里。
• 太空/舰载:对体积克克计较,CPO 把光引擎压到 3 mm 厚度,比传统方案轻 42%。
拆时间线:未来五年,谁主沉浮?
2024-2025:CPO 小批量,Google、Meta、阿里、腾讯四大云厂合计部署 ≤10 万端口,只占全球 800G 出货 5%。
2026-2027:51.2 T 芯片成为 Spine 主流,CPO 成本降到传统模块 1.5 倍,年复合增速 65%,高端场景渗透率 35%。
2028-2030:硅光激光器可靠性>50 万小时,CPO 首次下探 400G,传统模块在 100G-400G 依旧统治,但 800G 以上市场 CPO 占 60%,形成“高端 CPO、中低端可插拔”长期共存格局。
拆谣言:三大误区一次澄清
误区 1:CPO 会全面取代光模块
真相:2028 年全球光模块出货量 3.5 亿只,CPO 仅 3000 万端口,90% 场景仍需要可插拔。
误区 2:CPO 坏了就要报废整台交换机
真相:台积电 COUPE、Intel OCI 均设计“激光器可热插拔”子卡,5 分钟更换,MTTR 已缩短到 45 分钟,接近传统模块。
误区 3:CPO 更省电,所以数据中心都能省电费
真相:只有 51.2 T 以上 Spine 节点功耗下降显著;Leaf 节点仍以 10G-400G 为主,省下的电被 GPU 翻倍吃回去,整站 PUE 降幅有限。
拆给供应链:国产机会在哪?
• 硅光:中际旭创、光迅、海信已量产 400G 硅光芯片,2025 年 800G 硅光 Wafer 月产能 30 k,成本有望再降 20%。
• 封装:长电、华天、通富已拿到 Broadcom、NVIDIA 的 CPO 封测订单,国产替代率从 0→40% 只用 2 年。
• 激光器:武汉敏芯、苏州长瑞 100 mW 大功率 CW 激光器 2024 Q4 通过 5000 小时 HTOL,打破 II-VI、Lumentum 垄断,价格直降 35%。
拆结论:外挂不死,原生当立
传统光模块像 USB-C 接口,万能、便宜、好修,会长期统治“中低速+长距离”;
CPO 像 M1 芯片,把光电一体化做成 SoC,省功耗、省空间、冲速率,注定拿下“800G 以上+AI 集群”制高点。
未来十年的光互连,不是“谁干掉谁”,而是“外挂”与“原生”各守城池,共同把数据洪流从 800G 扛到 6.4T,再到 1 Pbps。
来源:睿智的鄭蜀黍
