胡耀文/宋云翔等NatureCommunications|超大规模薄膜铌酸锂芯

B站影视 港台电影 2025-10-12 14:45 1

摘要:在人工智能与超高速互联双重拉动下,如何把电子存储里的数据以更快、更省电的方式写入光域并完成计算,成为光计算真正走向工程应用的关键门槛。最新发表于 Nature Communications ,题为Integrated lithium niobate photo

导读

在人工智能与超高速互联双重拉动下,如何把电子存储里的数据以更快、更省电的方式写入光域并完成计算,成为光计算真正走向工程应用的关键门槛。最新发表于 Nature Communications ,题为 Integrated lithium niobate photonic computing circuit based on efficient and high-speed electro-optic conversion 的一项研究给出了一条实现路径:在薄膜铌酸锂(TFLN)平台上,把高效率、高带宽的电光(EO)调制与可扩展的片上光路整合为大规模系统,以“先写入、再并行、后读出”的流水线,实现通用矩阵-向量乘运算与推理任务。

论文由以哈佛大学为首的合作团队联合完成: 核心突破为实现了超大规模的薄膜铌酸锂芯片,含超过150个薄膜铌酸锂器件在同一个芯片上协同工作。为此,团队完成从波导、分束器到微波电极与端接的系统级设计与制造,并进一步展示了与混合集成激光器和异质集成探测器的扩展方案,使“光源-计算-探测”三大要素走向一体化。

文章展示的TFLN光计算加速器在“速度-能耗-可扩展性”上显示出优异的性能:在包含电-光转换后,单通道可在43.8 GOPS的速率下保持高保真计算,系统能耗降至0.0576 pJ/OP 的量级,整体运算速度达到了1.36TOPS;在算法与工程端,既完成二元分类与手写体识别等典型推理任务,也通过20 小时连续运行验证了稳定性。 文章第一作者为北京大学胡耀文和哈佛大学宋云翔,通讯作者为北京大学胡耀文、哈佛大学宋云翔、哈佛大学Marko Lončar。

一、结果:把“电写入光、在光中计算”落到芯片

该研究提出并实现了一套以 TFLN 为基底的系统级的大规模光计算加速芯片:首先,连续波激光进入第一级振幅调制器,电子系统输出的数据向量被时间复用地写入光振幅;随后,光在片上通过低损扇出树分配到多条空间通道,每条通道再用第二级振幅调制器写入对应的权重向量;两次调制后的光强天然等价于“数据×权重”的逐元素乘积,最后由高速光电探测转换为电信号并在电子端求和,得到点积结果。器件层面,作者以高质量干法刻蚀实现低损耗波导,进而支撑大规模光计算芯片;以金电极与片上电阻端接构建微波传输网络,使调制器可获得高带宽、低反射与较好的线性频率响应;以阵列化光栅与多级 Y-分束完成 1→16 的空间扇出,保证并行的光路一致性。在系统评测上,团队以随机向量乘、符号转换策略与时间同步校准为基元,给出了从符号波形拟合到最终误差分布的全链路计算性能度量:单通道 43.8 GOPS 算力下仍保持紧随理论轨迹,能耗最低达 0.0576 pJ/OP 时计算精度仍然稳健;在任务侧,电路完成了异或平面的二元分类(光计算与电子基线精度相当)、MNIST 手写体识别(光路 88%、电子 92%),并在20小时连续运行中仅呈现 0.04% 标准差的误差波动,显示出良好的抗漂移与抗扰动能力。更进一步,作者展示了带混合集成 DFB 激光与异质集成 MUTC 探测器的单通道系统:通过锥形边耦合器与贴合-蚀刻工艺,把 III-V 激光与高速 PD 集成到 TFLN 计算核的输入/输出侧,在单通道>10 GOPS 的速率下同样实现高保真计算,为未来多通道全片内自洽运行迈出关键一步。

图1:TFLN 光计算加速器工作原理示意图

图2:集成 TFLN 光路实物与关键单元制造示意图

二、讨论:为何选择薄膜铌酸锂平台

作者讨论了光计算的“短板补齐”框架:真正卡住体系跃迁式发展的,是把电子存储中的数据以足够快、足够节能的方式写入光域,也就是电光转换本身。TFLN 的强 Pockels 效应与强光-微波场约束,使其在“带宽、插损、驱动电压”的三角平衡上显著优于硅等平台,进一步叠加时间复用(高符号率)与空间复用(多通道扇出),就能在不牺牲能效的前提下实现大规模吞吐。作者指出,这种“以 TFLN 解决电光瓶颈,再与其他光学方案集成”的策略具有工程上的通用性:既可与自由空间衍射光计算或微腔-光频梳体系对接,形成“高带宽写入 + 大规模并行”的混合加速器;也能与多通道 DAC/ADC、FPGA 等高速电子做侧向或 3D 集成,充分利用空间复用能力。展望方面,论文明确给出几条工程可落地的路线: 把调制器的半波电压压低到毫伏级 、把带宽推到百吉赫、把波导损耗再降一个量级,这些指标在单器件层面已由TFLN相关先行示范;把工作波段推动到可见光可进一步降低能耗、缩短器件尺寸;引入片上封装,则有望把实验室级稳定性推动到应用级。在算法与系统层面,作者强调光子加速器低-中比特的实用意义:许多推理与信号处理任务更看重吞吐-能耗-延迟的系统最优,而非单点的极致精度,这恰是 TFLN 光计算核的优势区。

图3:异质集成TFLN光子计算加速核心

结语

这项工作以系统集成和算力规模为核心指标,在薄膜铌酸锂平台上,实现了超过150个铌酸锂器件协同工作的超大规模光子芯片系统,展示了薄膜铌酸锂在大规模、大尺度系统层面的应用可靠性。并在43.8 GOPS/通道的高速(1.36TOPS整体速度)与0.0576 pJ/OP的低能耗窗口内完成高保真计算,探索了TFLN光计算加速核心通往全片上运行的可行路径。此外,该计算核心兼容多种并行策略与封装方式,可与高速电子按需协同。随着更低驱动电压、更高带宽与 更低传播损耗 的系统级实现,以及稳定封装与多通道电子接口的完善,TFLN 光计算电路有望在数据中心互连、超快信号处理、机器视觉与量子调控等场景中得到广泛应用。

来源:博识雅士

相关推荐