摘要:公司还同时亮出了配套的软件、硬件和示范系统,说白了就是想把现在那些还带着“实验味”的量子机器,拉到能做实际工作的路上。因为这些消息,英伟达的市值被炒得接近5万亿美元,大家的眼睛一下子都亮了起来。
英伟达在周三凌晨的GTC上把一套能把量子处理器和自家GPU绑在一起的方案丢了出来:NVQLink——连着17家量子厂商和9家科研团队的互联架构。
公司还同时亮出了配套的软件、硬件和示范系统,说白了就是想把现在那些还带着“实验味”的量子机器,拉到能做实际工作的路上。因为这些消息,英伟达的市值被炒得接近5万亿美元,大家的眼睛一下子都亮了起来。
先说这事儿怎么来的。GTC 台上,黄仁勋把好几样东西摆在一起:面向未来通信的电信计算平台(往6G方向看)、量子互联、AI超级算力的规划,以及新一代GPU和液冷服务器。NVQLink不是独立做秀,而是被当成英伟达整个算力生态里的一个零件来介绍——意思很直接,量子机不能孤军奋战,得和现有的GPU世界拴在一起,互相配合才有用。
再说技术层面,核心点也挺明白。NVQLink基于英伟达最新的互联技术,给每块GPU提供非常高的双向带宽,大概在1.8TB/s这个量级,比常见的PCIe Gen5要快不少。更重要的是延迟控制到了亚微秒级,这玩意儿决定了GPU和量子处理器(QPU)能不能来回打电话而不磨蹭。英伟达还提出了机架级的全连通拓扑,像GB300 NVL72这种系统可以把多卡、多QPU的互联做成一套整体方案,便于在一个机柜里把混合计算放起来跑。
软件那块,英伟达推出了叫CUDA‑Q的统一编程平台。开发者能在一段程序里一起调度CPU、GPU和QPU,不用把量子和经典的两套工具拆成两份来写。它兼容多种量子硬件类型,像超导、离子阱这些都能接进来。另一个工具是cuQuantum,用来在经典机上模拟量子电路。官方给出的数字是,用cuQuantum模拟某些电路比传统CPU快90到369倍,能模拟到大约38个量子位的电路。对开发者来说,先在经典环境里调通算法,再把靠谱的那部分搬到真实QPU上去跑,这套路挺实用的。
有一点特别值得注意:英伟达把GPU当成量子纠错时的经典计算后援。现在量子机的难题就是噪声和误差,要做实时的错误检测、解码和校准,需要不少经典算力。英伟达的思路是让QPU专心干量子态演算,GPU来承担那些纠错、解码以及快速反馈的活儿。现场演示里出现了像DGX Quantum这样的系统,搭配Quantum Machines的平台,能把误差检测和校准做到亚微秒级别。英伟达还提到有实验在中性原子QPU上验证了特定的错误检测码,标注为(4,2,2)的检测码实验,就是把这个思路往具体实现上靠。
生态层面,NVQLink并非封闭俱乐部。英伟达把它当开放的架构来做,目前宣布已经有17家量子硬件公司和9家科研机构加入适配,工具链也支持行业常用的框架,比如Qiskit。换句话说,开发者不用重头学一套新东西,就能在熟悉的环境里尝试混合量子程序;硬件厂商也减少了对接上层应用时的磨合成本。英伟达把这些伙伴和工具连成一条链,就是想把量子计算纳入现在的开发和部署流程里。
至于能做啥,厂方点了几类应用:药物分子模拟、材料设计、催化剂研发这种。宣传里提到,在某些关键步骤上,GPU+QPU的协同能把速度提升数百到上千倍。听起来夸张,但逻辑不难理解:很多模拟里有个瓶颈步骤,传统经典机占了大头,如果把那个瓶颈交给量子来处理,整体加速就可能很明显。只是要把这些实验室里的“加速”变成工业级的、稳定的能力,还需要更多工作。
把时间线拉长来看,英伟达不是突然说想玩量子。这事儿放到全球背景里,其实是顺应趋势。各国都把量子技术写进长期规划,企业和研究机构都在加紧布局。中国“十四五”“十五五”规划里都有对量子科技的重视,国际上也有不少大公司和初创在跑。英伟达是现有算力生态的中心,想把自己在GPU和互联上的优势延伸到量子领域,让未来的量子工作负载能接入现有平台,这个想法合情合理。
发布会上还提到一些基础设施和路线图的细节,不只是互联卡和软件。液冷服务器的部署、后续几代GPU的演进路线都被提出来,这些都是为了解决当量子和GPU需要高密度协同工作时,底层设施不会成为瓶颈。市场方面,消息出来后投资者很活跃,英伟达的估值被频频提到,这说明“算力+量子”这张牌在资本市场还有很大想象空间。
但现实里还有不少门槛。现在的量子机在噪声、量子位扩展性和稳定性上还有短板,真正能大规模、容错运行的量子计算机还没到来。英伟达提出的混合路线更多是应对NISQ(有噪声的中等规模量子设备)时代的一种过渡方案:把能用经典方法解决的部分留给GPU,量子机干它擅长的、且能带来优势的那一块。这能让研究和工程上有得做,但距离全面替代传统超级计算还有段路。
合作细节也值得留意。那17家企业和9家实验室覆盖了不同的量子硬件类型和研究方向。英伟达把自己放在“中间层”的位置上:既提供强劲的经典算力,又做量子接入的桥梁。开发者能少改造工具链去试混合程序,硬件厂商也能少操心上层对接问题。对整个生态来说,这是把不同环节的摩擦降下来,利于更多实验跑起来。
国内的角度简单说两点。一是英伟达在算力领域的分量不小,这次布局自然引起关注;二是国内在通信和部分算力系统上能和英伟达竞争的企业并不多,华为常被拿来当作最可能的对手。量子领域的竞争更分散,既有巨头也有专门的初创和高校团队。英伟达先把互联和编程栈搭好,谁能在硬件或者某个具体应用上赢得先机,还得看后续的攻关和落地速度。
演示里那些具体数据也能给人一些直观印象。英伟达提到,借助cuQuantum在某些电路上的经典模拟速度,比CPU快90到369倍,能模拟到38量子位左右。把纠错的经典计算放到GPU上,结合低延迟的互联,可以把误差检测、解码和实时校准做得更快,这些对研发人员判断混合系统的潜力很有参考价值。
GTC上除了技术,还有一系列合作、产品路线和基础设施的计划被宣布。接下来的几个月里,厂商和研究机构会把相关支持逐步落地到各自的平台或硬件上,真正能跑出多少实际效果,得看这些工作怎么推进,以及在实际应用场景里能不能把理论优势转成可重复的效能。
来源:随性观书画一点号
