Nature 聚焦!物理神经网络,撑起可持续 AI 新方向

B站影视 内地电影 2025-09-16 23:58 1

摘要:传统硅基计算架构,正被这疯狂增长的能耗和速度需求逼到墙角,好在一项发表在《自然》杂志上的研究,给AI发展带来了新转机。

你知道现在训练一个像ChatGPT这样的大型语言模型有多“费电”吗?

说出来可能吓一跳,单次训练的耗电量抵得上几千户普通家庭一年的用电量。

传统硅基计算架构,正被这疯狂增长的能耗和速度需求逼到墙角,好在一项发表在《自然》杂志上的研究,给AI发展带来了新转机。

过去AI计算全靠数字电子器件“干活”,把连续的物理信号折腾成离散数字信号,再通过逻辑门电路一点点处理。

这过程就像非要把散装货物一个个打包好,再挨个搬运,既费时间又耗精力。

也难怪传统AI计算会撞上功耗和速度的“南墙”,像ChatGPT训练时那惊人的耗电量就是明证。

而光子神经网络完全换了套思路,它直接利用光的干涉、衍射这些物理现象来计算,信息以光波形式传播。

米兰理工大学的FrancescoMorichetti教授解释,光子芯片省掉了信息数字化的繁琐操作,能耗和处理时间都大幅降低。

毕竟光速可比电子移动速度快多了,而且光子之间没有“排斥力”,天然就适合AI计算里最核心的矩阵乘法。

这么一看,光子计算简直就是为解决传统AI计算难题而生的。

对神经网络来说,光会“前向计算”还不够,还得能“学习”。

在传统数字系统里,神经网络靠反向传播算法来调整参数,但这招在物理系统里却行不通。

这次《自然》研究最厉害的地方,就是找到了在物理域训练光子神经网络的办法,“原位”训练技术。

不过这可不是简单的技术优化,而是对传统机器学习理论的重新思考,研究团队得解决一堆基础问题,像怎么在物理系统里算梯度、怎么对付噪声干扰。

本来想着这训练过程会很复杂,结果Morichetti说不仅速度更快,还更稳健高效,确实让人意外。

米兰理工大学在这次研究里,主要贡献是集成光子技术,他们把复杂光学器件集成到小小的硅微芯片上,实现了数学运算的光学化。

集成光子芯片的优势很明显,体积小、功耗低,还能大规模生产,和现有的半导体制造工艺也能“兼容”,这就给光子神经网络的产业化铺好了路。

现在的光子神经网络芯片计算密度已经很可观了,相同芯片面积下,光子器件能支持更高的互连密度,对构建大规模神经网络特别有用。

而且它低功耗的特点,在移动和边缘计算领域简直就是“香饽饽”。

说到应用,数据中心肯定是最先受益的。

全球数据中心耗电量占比可不低,AI训练和推理又是耗电大户,光子神经网络要是普及,能大大降低AI计算的能耗。

在边缘计算方面,它能解决传统AI数据传输的延迟和隐私问题,直接把复杂AI模型部署到终端设备上。

就拿自动驾驶汽车来说,车载AI系统要实时处理大量传感器数据,还得快速做出决策。

光子神经网络既能满足计算需求,又能适应车辆的功耗和散热条件,智能手机、无人机这些设备,也都能从中获益。

在工业物联网里,光子神经网络能让传感器变得更“智能”,现场就能完成数据分析,减少数据传输量。

不过,光子神经网络离真正普及还有不少坎要过,精度就是个大问题,物理系统容易受温度、振动这些环境因素影响,怎么保证计算结果准确稳定,还得深入研究。

规模化也不好搞,现在它还在实验室阶段,要达到大型数字神经网络的规模,从器件技术到系统架构都得突破。

制造成本也是个现实难题,虽然和传统半导体工艺能“搭上边”,但光子器件制造精度要求更高,良品率不好控制。

另外,软件生态也得跟上,开发者需要新的编程工具和框架。

但毫无疑问,光子神经网络不会完全取代数字AI系统,它会在适合的场景里发光发热。

混合计算架构,把数字处理器的灵活性和光子神经网络的高效结合起来,说不定会成为下一代AI系统的主流。

随着技术不断进步,光子神经网络肯定会在打造更高效、可持续的AI系统上发挥关键作用,推动AI技术往更广阔的领域发展。

来源:念寒尘缘

相关推荐