摘要:过去十年,AI算力大战像是一次“硬件加速版”的《速度与激情》:上一秒GPU仍在领跑,下一秒就有ASIC、TPU、NPU等各种“改装赛车”呼啸而来。我们从去年下半年开始讨论ASIC,今年初讨论PD分离和MoE架构对于NV的影响,很早就关注到了模型技术演进对于底层
打赏我们一本AI应用百科全书
本篇文章仅代表作者的个人看法,还未形成详细的调研报告,详细的趋势会结合未来一段时间的调研再作总结。
过去十年,AI算力大战像是一次“硬件加速版”的《速度与激情》:上一秒GPU仍在领跑,下一秒就有ASIC、TPU、NPU等各种“改装赛车”呼啸而来。我们从去年下半年开始讨论ASIC,今年初讨论PD分离和MoE架构对于NV的影响,很早就关注到了模型技术演进对于底层算力的变化需求。
Computex2025见证了最戏剧化的一幕——向来将ASIC视作“旁门左道、白送也没人要”的JensenHuang,突然在台北舞台上抛出NVLinkFusion,正式邀请第三方ASIC接入Nvidia的“AI工厂”管线。这一举动不仅改写了Nvidia对ASIC的叙事,也宣告了AIASIC时代已不可逆转,尤其在推理(inferencedecoding)场景中更显锋芒。当然,NvidiaGPU一定还是算力不可或缺的主力之一,只是相比之下,ASIC有着更大的增量空间。
1.老黄早年立场:GPU才是“未来保险”,ASIC注定“还在路上”
趣味对比:那时的GPU在Huang口中是“瑞士军刀”,而ASIC只是“一把钉子锤”——钉子换了就得重新造锤子。
2.中段过渡(2022–2024):警惕但自信,软件生态、互联+计算一体化成为新护城河
随着AWSInferentia、Tranium、GoogleTPUv5、TeslaDojo等ASIC落地,Huang换了说法:“多数ASIC项目无法在我们的下一代GPU发布后仍保持优势,因为整套软件栈太复杂,不是谁都能重来一遍。”(Q4FY2025业绩电话会纪要)
3.Computex2025:官方“投诚”——NVLinkFusion向第三方ASIC敞开大门
在台北音乐中心的90分钟独角戏里,Huang抛出了NVLinkFusion:
提供chipletPHY+IP,允许Alchip、Marvell、MediaTek等在自家ASIC里直接挂上NVLink,总线带宽与BlackwellGPU等价。
同时宣布Grace-Blackwell架构支持异构任务调度,第三方芯也能由CUDA/Nimble驱动。
4.为什么偏偏是InferenceDecoding先被ASIC颠覆?
5.Nvidia的两手策略:GPU继续开路,ASIC交过路费
6.结语:从鄙视到拥抱,ASIC趋势已成大势
GPU仍是瑞士军刀,但在这个“Token工厂”时代,每把菜刀也在自成流派。
JensenHuang想做的,是把整座厨房的排烟管都换成了NVLink。
当然这套NVLinkFusion好不好推,会持续跟踪,难度也很大。
Discord每周作战会议
上上周三我们讨论了苹果税对行业影响以及对Applovin的业绩前看法。
上周三我们讨论了AWSASIC产业链机会,腾讯业绩前看法,以及MNDY业绩点评。
本周三我们计划讨论两家AI应用公司SNOW与OKTA的业绩前看法。
Discord里有非常多美股讨论内容,以及很多一手信息。以及经常的Meetup活动,也是主要给Discord用户参加。
我们上线了投研扫盲Agent的Beta产品,可以替换实习生的部分工作,欢迎进入Discord试用和提出意见。
很多人在体验
机构客户进入Discord方法
机构客户进入Discord讨论区指引
来源:周姐说汽车