摘要:凌晨三点的美国新墨西哥州,桑迪亚国家实验室的超级计算机机房里,高级科学家詹姆斯·拉罗斯盯着屏幕上的核模拟数据,揉了揉发红的眼睛——这是他们用NextSilicon的“Maverick-2”芯片跑的第三周,结果让他差点摔了咖啡杯:同样的核爆炸建模任务,速度比英伟
凌晨三点的美国新墨西哥州,桑迪亚国家实验室的超级计算机机房里,高级科学家詹姆斯·拉罗斯盯着屏幕上的核模拟数据,揉了揉发红的眼睛——这是他们用NextSilicon的“Maverick-2”芯片跑的第三周,结果让他差点摔了咖啡杯:同样的核爆炸建模任务,速度比英伟达A100芯片快32%,功耗却低了41%,最关键的是,一行代码都没改。
一、当英伟达“转战AI”,这家以色列公司捡走了“被遗忘的算力高地”
2023年的一个清晨,NextSilicon的创始人团队挤在特拉维夫的小办公室里,盯着英伟达的最新财报发呆。“Nvidia把90%的研发投入都砸向了低精度AI计算,比如生成式AI的FP16、INT8运算。”现任CEO埃兰·佩雷斯后来回忆,“但他们忘了,这个世界还需要能跑核模拟、气候模型、量子化学的高精度算力——那些不能妥协精度的‘硬骨头’。”
这句话成了NextSilicon的创业纲领。他们要做一款“反AI潮流”的芯片:不是为了更快生成图片或文本,而是为了让科学家能更精准地模拟核反应堆的链式反应、预测飓风的路径,或是研发能治愈阿尔茨海默病的新药。
三年后,这款名为“Maverick-2”的中央处理器正式亮相。它不是要取代英伟达的AI芯片,而是补全了算力生态里最稀缺的“精准拼图”:
- 精度不妥协:支持FP64(双精度浮点运算),这是科学计算的“黄金标准”——比如模拟核爆炸时,小数点后15位的误差都可能导致模型失效;
- 兼容现有生态:不需要科学家重写用了十年的代码,直接替换英伟达芯片就能用;
- 能效比碾压:同样跑量子化学模拟,Maverick-2的功耗只有英特尔至强芯片的60%,比英伟达H100低35%。
二、“RISC-V+高性能芯片”组合拳,打在了巨头的软肋上
更让行业震动的是,NextSilicon同步推出的配套RISC-V中央处理器。这个选择藏着两个“阳谋”:
1. 用开源架构绕开巨头的专利墙
Intel的x86和Arm的架构都是闭源的,每做一款芯片都要交高额授权费。而RISC-V是免费开源的,全球开发者都能参与改进——这对初创公司来说,等于拿到了“免费的设计图纸”。
NextSilicon的RISC-V CPU不是用来做通用计算,而是专门配合Maverick-2做“系统调度”:比如把科学计算中的并行任务分配给Maverick-2,把控制逻辑交给RISC-V,让整个系统效率最大化。用桑迪亚实验室工程师的话说:“就像给跑车配了个更聪明的变速箱,动力能发挥得更彻底。”
2. 抢在英伟达“补位”前占领生态
英伟达不是没做过高性能计算芯片,但它的重心早已转向AI。NextSilicon的算盘很清楚:趁英伟达还没回头,先把科学计算领域的客户绑在RISC-V生态上。
比如美国的劳伦斯利弗莫尔国家实验室,已经用NextSilicon的系统替换了部分老化的IBM芯片;欧洲的核子研究中心(CERN)也在测试其用于粒子对撞数据的分析——这些客户一旦习惯了RISC-V的兼容模式,未来很难再回到闭源架构的怀抱。
三、中国玩家在哪里?我们在“高精度算力”赛道悄悄布局
当NextSilicon在美国搅动算力格局时,中国的科技公司也没闲着——只是我们的“战场”略有不同,但底层逻辑高度一致:用开源和自主创新,填补全球算力的细分缺口。
1. 寒武纪:用“云端智能芯片”切入高精度计算
寒武纪的“思元590”芯片,虽然主打AI推理,但它的FP32(单精度浮点)性能达到了256 TFLOPS——足以应对一部分科学计算任务。更关键的是,寒武纪基于RISC-V开发了“玄铁C910”核,用来做芯片的控制平面。“我们的思路和NextSilicon类似,”寒武纪研发负责人说,“用开源架构降低成本,同时强化特定场景的算力。”
2. 平头哥:RISC-V的“生态基建者”
阿里旗下的平头哥,已经把RISC-V做到了手机、物联网、汽车芯片——但它没止步于此。今年早些时候,平头哥发布了“曳影1520”,这是一款支持FP64的RISC-V服务器芯片。“我们想证明,RISC-V不是只能做低功耗设备,”平头哥CEO胡振波说,“它也能扛起科学计算的重任。”
3. 超级计算机:中国的“高精度算力试验场”
中国的“神威·太湖之光”超级计算机,用的是自主设计的“申威26010”芯片,FP64性能达到9.3 PFLOPS——这比很多商业公司的芯片更早解决了“高精度算力”的问题。现在,太湖之光的团队正在和寒武纪合作,把RISC-V架构引入超级计算机的调度系统,“目标是让算力利用率再提升20%”。
四、对普通人来说,这场“算力战争”意味着什么?
你可能会问:一款跑核模拟的芯片,和我有什么关系?答案藏在生活的细节里:
1. 新药研发更快,癌症患者能更早用上靶向药
以前研发一款抗癌药,需要用超级计算机模拟100万种分子结构,耗时5-7年。如果用NextSilicon或寒武纪的芯片,速度能提升3-5倍——意味着一个肺癌患者的救命药,可能从“等10年”变成“等2年”。
2. 气候预测更准,极端天气不再“突然袭击”
欧洲中期天气预报中心(ECMWF)测试过NextSilicon的芯片,发现其模拟的台风路径误差比原来小了25%。“以后台风预警能提前3天,而不是1天,”ECMWF的气象学家说,“普通人能多一点时间准备。”
3. 工业设计更高效,新能源汽车充电更快
特斯拉的电池研发团队,用高性能芯片模拟锂离子电池的热管理——如果算力提升,电池的能量密度能增加10%,意味着新能源汽车的续航从600公里变成660公里,充电时间缩短半小时。
五、未来:算力的下一个战场,是“精准”与“通用”的对决
NextSilicon的崛起,本质上是算力需求的分化:以前大家都想要“能跑AI的芯片”,现在越来越多行业需要“能精准解决问题的芯片”。
对中国公司来说,这是个机会:
- 抓住RISC-V的窗口期:开源架构让我们能快速迭代,不用被Intel或Arm卡脖子;
- 深耕细分场景:比如科学计算、工业仿真、生物医药,这些领域的算力需求更具体,更容易建立壁垒;
- 强化生态协同:像平头哥那样,从芯片到操作系统再到应用,打通整个链条。
结语:算力不是“越大越好”,而是“越准越好”
英伟达的成功,是因为它抓住了AI时代的“通用算力”需求;而NextSilicon的机会,是它看到了“精准算力”的缺口。对中国科技行业来说,我们不需要复制谁的路径——我们需要做的是,在自己的优势领域,把“精准”做到极致。
就像桑迪亚实验室的詹姆斯说的:“以前我们用英伟达芯片跑核模拟,要花两周时间调代码;现在用NextSilicon,第一天就能出结果。” 这种“把时间还给科学家”的算力,才是真正的“生产力”。
当全球都在追逐AI的浪潮时,不妨回头看看——那些被遗忘的“精准算力”,正在长出下一个科技巨头。而中国公司,已经站在了这个赛道的起点。
延伸思考:如果有一天,你家的空调能根据精确的气候模型自动调温,你吃的药是靠高精度算力研发出来的,你会不会意识到——那些藏在实验室里的芯片,早已改变了你的生活?
来源:智能学院
