AI训练一次耗电2.4亿度!还好有人发明了这种芯片,能省99.9%的电!

B站影视 电影资讯 2025-08-28 11:06 3

摘要:“我们让硅片像一杯热水一样思考——温度升高,答案自然浮现。”Normal Computing CEO法里斯・斯巴赫(Faris Sbahi)在CN101流片发布会上的这句话,揭开了全球首款热力学计算芯片(thermodynamic computing chip

作者 / 钱亚光

编辑 / 张 南

设计 / 柴文静

“我们让硅片像一杯热水一样思考——温度升高,答案自然浮现。”Normal Computing CEO法里斯・斯巴赫(Faris Sbahi)在CN101流片发布会上的这句话,揭开了全球首款热力学计算芯片(thermodynamic computing chip)的神秘面纱。

当地时间8月12日,美国初创公司Normal Computing宣布,专为AI/HPC(人工智能/高性能计算)设计的CN101热力学计算芯片完成流片,在特定训练任务中能效达到传统GPU的1000倍。这一消息引发行业震动,不少人将其与当年谷歌“TPU时刻”相提并论。

这款芯片的出现,不仅让热力学芯片这个相对陌生的领域走进大众视野,也让人们开始思考:它会颠覆传统芯片吗?又有着怎样的发展故事与未来前景?


01
用温度算题,把噪声当帮手

传统芯片就像一丝不苟的会计,对数据要求极致精准,0就是0,1就是1。为了避免出错,它得把电压调得很高,靠消耗大量能量来保证计算结果的确定性。

而热力学芯片的工作原理和传统芯片完全不同。它更像一位佛系画家。一开始,让晶体管处于随机的混沌状态,接着利用热噪声推动系统向低能量方向“流动”。当芯片内部的温度场稳定下来,根据统计物理定律,就能直接得到概率分布的答案。

简单来说,它把传统芯片的计算过程变成了冷却过程,能耗自然大幅降低。

热力学芯片创新性地利用微观粒子的热运动规律和热力学系统的能量转换机制,通过设计特殊的微观结构和材料,打造可控的热力学循环过程,让信息的编码、传输和运算直接与系统的熵变(混乱程度变化)、能量传递挂钩。

这种基于热力学定律的模式,天生就和物理世界的能量流动相契合,为解决传统芯片在特定场景下的能效难题提供了新方向。

芯片内部有大量微型热力学单元,每个单元都是一个独立的能量节点,能通过吸收或释放热量改变自身热力学状态,这些状态的组合与变化就对应着不同的数据。

当进行计算时,系统精准控制各单元间的热量交换路径和速率,模拟传统计算中的逻辑门操作。比如,通过调节两个热力学单元的能量耦合强度,就能实现“与”“或”“非”等基础逻辑运算,进而完成复杂的数据处理。

传统芯片拼命抑制物理系统中的波动和噪声,追求确定的计算结果,热力学芯片却反其道而行之——它利用系统本身的随机性和波动(比如热噪声)来计算。这种“借力随机”的方式,特别适合那些依赖概率和不确定性的算法。

现在计算需求猛增,尤其是AI领域对算力需求极大,能耗问题越来越突出。热力学芯片利用自然动态计算,不用像传统芯片那样消耗大量能量维持精确计算,能耗大幅降低。

据报道,在特定AI和科学计算任务中,它的能耗效率比传统硅基系统高100至10000倍。这对大规模数据中心来说,意味着运营成本大幅下降,也更符合可持续发展需求。

另外,它还突破了传统二进制的局限。传统芯片用0和1表示数据,而热力学芯片采用“概率比特”(p-bits),能表示多种状态,在处理蒙特卡罗模拟、贝叶斯推断等依赖随机性的复杂算法时,性能远超传统芯片,为AI、金融建模等领域提供了更强的计算支持。


02
从理论到流片:热力学芯片的“进化史”

热力学芯片的出现不是偶然,背后是多年的理论探索和技术突破。

早在19世纪,麦克斯韦就提出了“麦克斯韦妖”思想实验:一个“小妖”能根据分子速度分类信息,这一实验首次将信息和熵(热力学概念)联系起来,为热力学与信息学的结合埋下种子。

2012年,瑞士洛桑联邦理工学院(EPFL)取得重要突破,首次用纳米级电子器件演示了“热涨落计算”,让热力学计算从理论向实际应用迈出了一小步。

2022年,原谷歌大脑/谷歌X团队的法里斯・斯巴赫、扎卡里・贝拉泰奇(Zachary Belateche)等人创立了Normal Computing公司,目标是把热力学计算从实验室推向实际产品。

虽然很难说清谁是热力学芯片的唯一发明者,但全球众多科研团队和机构都在不同阶段贡献了力量。随着AI对算力和能效要求越来越高,热力学芯片的研究速度加快。此次Normal Computing推出的CN101芯片,标志着热力学芯片正式从理论研究迈向产品化。


03
不取代传统芯片,而是互补搭档

很多人担心,热力学芯片会把CPU、GPU等传统芯片“扫进历史垃圾堆”,但实际上,二者更像是“互补搭档”,而非替代关系。

传统硅基芯片发展多年,在确定性计算(比如日常办公、打开网页、刷短视频)、通用计算场景以及生态建设上,有着无法替代的优势。未来很长一段时间里,它依然会是主流计算芯片,承担基础计算任务。

而热力学芯片只擅长非确定性算法,比如采样、生成、优化等任务,没法处理日常的确定性计算。但在能耗敏感、依赖概率计算的领域,它表现突出,比如AI训练和推理、复杂科学模拟等。

未来,二者结合能实现“1+1>2”的效果——计算系统可根据不同任务,调用最合适的芯片,让性能和能效达到最优。以AI数据中心为例,CPU负责通用计算,GPU负责图形处理和部分AI任务,热力学芯片则专注加速AI算法中的概率计算部分,三者协同提升整体算力。

从CN101芯片来看,它基于Normal Computing的Carnot架构,专为AI与HPC数据中心设计,在两个关键领域表现亮眼:

一是线性代数和矩阵运算,能高效求解大规模线性系统,支持工程、科学计算和优化任务;

二是用晶格随机游走(LRW)进行随机采样,大幅加速科学模拟和贝叶斯推理所需的概率计算,在这些任务中,能耗效率能达到传统芯片的1000倍。

因此,未来的AI服务器很可能形成“CPU+GPU+热力学芯片”的异构形态,三者各司其职,共同提升计算效率。


04
商业化:刚起步,前景广阔也有挑战

目前,热力学计算的商业化还处于起步阶段。CN101芯片成功流片是重要里程碑,但距离大规模量产和广泛应用还有不少路要走。

现在市场上相关产品很少,但已有企业和科研机构开始探索应用。比如在金融风险模拟、AI图像生成加速等领域,部分企业已经开展试点,测试热力学芯片的实际效果。

从长远来看,热力学芯片前景广阔。随着AI和科学计算需求持续增长,行业对高能效、高性能计算技术的需求越来越迫切,而热力学芯片正好能填补这一缺口。

不过,热力学芯片目前还面临不少挑战:

首先是应用场景受限。它只适用于非确定性结果的应用,像网页浏览、常规办公软件这些需要确定性输出的场景,它根本用不上,应用范围相对较窄。

其次是技术成熟度不足。作为新兴技术,它在制造工艺、性能稳定性上都不够成熟。比如7nm以下的晶体管本身就有随机掺杂问题,而热力学芯片还要“放大”这种随机性,导致良率控制难度大增。

同时要保证每片芯片性能一致、计算可靠,还需要在材料、设计和制造工艺上取得重大突破,如何精准控制芯片组件的随机行为,确保计算结果可靠一致,也是亟待解决的难题。

第三是成本高昂。热力学芯片的研发成本很高,生产设备和工艺也和传统芯片不同。如何降低成本,让产品在价格上有竞争力,是实现规模化量产的关键障碍。

最后是软件生态缺失。目前还没有完善的适配热力学芯片的操作系统、编译器、开发工具等。传统软件无法模拟“噪声即资源”的计算逻辑,开发者需要重新学习如何把AI任务“翻译”成热力学芯片能理解的“温度语言”,编译器、调试器也得重新开发。因此,构建丰富的软件生态,吸引更多开发者为其开发应用,是规模化量产必须跨越的又一道坎。


05
玩家们:全球探索者各有方向

Normal Computing CEO法里斯・斯巴赫▼

在热力学芯片领域,Normal Computing是目前最受关注的企业。公司由法里斯・斯巴赫于2022年创立,在纽约、旧金山、伦敦、哥本哈根设有办公室,现有45名成员。

核心团队成员来自Google Brain、Google X和Palantir等科技巨头,在AI、芯片设计、复杂系统开发等领域经验丰富,为公司带来了前沿技术理念和深厚的技术积累。

2023年6月,该公司完成850万美元种子轮融资,由Celesta Capital领投。

它的商业模式很清晰:短期和财富500强企业合作开展试点,提供概率AIaaS(AI即服务);长期计划销售CN系列ASIC芯片和异构服务器整机,对标英伟达的DGX服务器。

在产品规划上,这家公司分阶段推进:今年用CN101芯片展示关键应用;明年推出CN201,针对高分辨率扩散模型和扩展AI工作负载优化,提升性能;2027年底或2028年初推出CN301,进一步拓展到高级视频扩散模型领域,逐步扩大市场份额,实现大规模商业化。

除了Normal Computing,全球还有少数企业和科研机构在热力学芯片领域发力。

Extropic公司首席执行官、创始人纪尧姆・韦尔东(Guillaume Verdon)和首席技术官兼联合创始人特雷弗・麦考特(Trevor McCourt)▼

Extropic公司是另一支重要力量,已融资1400万美元,目前约20名工程师全职投入研发。它采用“超导原型+CMOS”路线,聚焦于控制标准硅片中的热力学效应实现高效计算,同时避免传统热力学计算需要的极端冷却方法,降低成本和技术难度,计划2026年推出室温CMOS版本的芯片。

瑞士日内瓦大学尼古拉斯・布伦纳(Nicolas Brunner)团队则另辟蹊径,开发出一款用量子比特和热量模拟神经连接的设备。计算时,不用键盘输入,只需提高部分热库的温度,让热量流过设备,改变量子比特的量子态和能量;读取结果时,检查指定“监视器”热库的温度即可。

在国内,清华大学交叉信息院、中国科学院相关研究所等高校和科研机构也开始涉足这一领域,开展基础理论研究,探索适合国内产业需求的技术路线,但目前尚未有像Normal Computing那样取得产品化突破的报道。

热力学芯片作为计算领域的新兴力量,虽然目前面临应用场景窄、技术不成熟、成本高、生态缺失等挑战,但潜力巨大。

随着技术不断成熟、软件生态逐步完善,它有望为我们带来更高效、更节能的计算体验,在未来科技舞台上绽放光彩,为AI等前沿领域的发展注入新的活力。

或许,在不久的将来,“用一杯咖啡的能量跑完AI训练”不再是梦。

来源:轩辕商业评论

相关推荐