摘要:哎呀,AI芯片战场上,中美较量越来越白热化了!最近,美国经纪研究报告直指,NVIDIA的AI GPU在中国市场不光没被本土厂商挤出,还因为软件生态和集群性能大受欢迎,尽管我国政府一再推动“自力更生”。报告聚焦四个关键点:中芯国际的7nm良率瓶颈、云服务商的采购
哎呀,AI芯片战场上,中美较量越来越白热化了!最近,美国经纪研究报告直指,NVIDIA的AI GPU在中国市场不光没被本土厂商挤出,还因为软件生态和集群性能大受欢迎,尽管我国政府一再推动“自力更生”。报告聚焦四个关键点:中芯国际的7nm良率瓶颈、云服务商的采购策略、NVIDIA的B40专用芯片,以及AI投资大潮。行业专家觉得,这事儿暴露了我国AI硬件的自给之路还长,华为的Ascend 910C虽性能追近NVIDIA H100的60%,但生态和效率差距让本土芯片难敌。想想看,云巨头如阿里、腾讯还得靠NVIDIA的CUDA框架训练模型,这波“渴求”能让NVIDIA在中国赚翻天。咱们来细聊聊这背后的技术门道和市场风云,看看谁能笑到最后。
AI芯片;图片来源于网络,侵删;
报告第一个痛点直指中芯国际(SMIC)的7nm工艺:良率低迷,产能不足,让本土AI芯片生产卡壳。华为的Ascend 910C虽是明星产品,但据爆料,大部分芯片还是用台积电(TSMC)的7nm芯片,通过第三方渠道批量采购。为什么?中芯的7nm N+2工艺起步良率只有20-30%,2025年爬到40%,远低于全球标准的60-70%。这意味着一堆晶圆做出来,坏的占大头,成本高得吓人。
技术上,Ascend 910C用Da Vinci架构,双芯片let设计(相当于两个910B打包),FP16性能320-800 TFLOPS,INT8 64 TFLOPS,内存带宽3.2 TB/s,能达到NVIDIA H100推理性能的60%,甚至超B20。但训练大模型时,FP8内存优化格式支持弱,华为虽有翻译工具,但效率打折。CloudMatrix 384集群(384颗Ascend芯片)在某些任务超NVIDIA GB200 NVL72,但功耗高3.9倍,用电成本翻倍。专家分析,这反映我国半导体供应链的结构性问题:美国和荷兰出口管制卡住先进光刻机,中芯虽进步,但7nm以下节点遥远。2025年,华为计划产10万颗910C,销量20亿美元,但比NVIDIA H20的100万颗(120亿美元)差远了。长远看,若良率破60%,本土芯片能抢更多份额;否则,继续依赖进口。
第二个焦点是我国云服务提供商(CSPs)的采购策略:一边囤NVIDIA H20,一边转华为,但NVIDIA生态太强。美国众议院正推“Remote Access Security Act”,防我国企业通过云租用NVIDIA高端GPU(如H100)。但现实中,阿里云、腾讯云等巨头仍偏好NVIDIA,因为CUDA框架优化AI训练,NVLink互联让集群效率高30%。
比如,DeepSeek的DeepGEMM模型(2025年2月发布)虽用CUDA训练,但本土厂商如Cambricon的Siyuan 590也支持UEBMO FP8格式,内存省力。但华为CloudMatrix 384不支持原生FP8,人工兼容不完美。报告说,字节跳动、百度、中国移动已下单7万颗Ascend 910C(价值20亿美元),但NVIDIA H20需求仍爆棚——2025年出货超100万颗,营收120亿。为什么?H20虽“阉割版”(性能降级),但软件支持牛,集群跑大模型稳。趋势上,2025年我国AI CapEx超1400亿美元,CSPs策略是“双轨”:高性能用NVIDIA,国产化用华为。专家洞察,这法案若通过,云租用H100的“漏洞”堵死,推本土芯片加速,但短期NVIDIA份额稳在75%以上。
报告第三个亮点是NVIDIA的B40 AI GPU:专为我国设计,基于Blackwell架构,无需高带宽内存(HBM),主打推理而非训练,不用额外许可证,就能卖到我国。特朗普政府虽批H20出口(分15%给美方),但政策圈推H20,B40成新宠。RTX Pro 6000D系统用B40,性能超H20 80%,集群互联强,适合阿里、腾讯的推理任务。
技术上,B40用GDDR6X内存,带宽1TB/s,FP16 1000 TFLOPS,功耗低20%,比Ascend 910C省电。报告说,一旦上市,会“热卖”——我国企业渴求NVIDIA的CUDA,国产芯片如华为的CANN框架虽开源,但开发者生态弱。Cambricon股价狂飙,Siyuan 590销量涨,但经纪研究仍看好NVIDIA:软件+互联双杀。市场趋势:2025年AI推理市场超5000亿美元,我国占30%,B40能帮NVIDIA守住份额,避开训练禁令。
最后一个点是AI CapEx计划:我国推100%自给,巨头砸钱建数据中心。但报告强调,NVIDIA GPU优于本土:CUDA生态开发者超百万,集群性能高,FP8支持原生。华为Ascend 910C虽成本低(两颗等于一颗H100,但价半),但功耗高、生态锁死(买芯片得买华为全套)。阿里自研AI GPU起步,DeepSeek模型用NVIDIA训练,本土厂商转UEBMO格式兼容。
从工程看,AI芯片从“硬件堆砌”转“生态战”:NVIDIA的NVLink带宽超4TB/s,集群扩展性强;华为CloudMatrix需更多芯片补性能,电费翻倍。2025年,我国AI芯片本土化率75%,华为领头,但NVIDIA中国营收13%(超150亿刀)。专家洞察:自给目标虽雄心,但短期难敌NVIDIA软件壁垒。长远,Ascend 910D/920(6nm工艺,900 TFLOPS)或追平Blackwell,但需破HBM禁运。全球AI市场2025年超9820亿美元,我国CSPs如字节、腾讯的投资拉动,但“渴求”NVIDIA说明生态为王。
这报告凸显AI芯片“冷战”:NVIDIA靠生态逆袭,华为靠本土化突围。但经纪研究共识:NVIDIA GPU仍是首选,B40上市后销量爆。2025年,Ascend 910C出货10-30万,NVIDIA H20/B40超百万,我国自给率升但性能差距在。消费者和企业呢?AI训练成本降,但生态选择难。你觉得华为能超NVIDIA吗?这波芯片大战,越来越刺激!
来源:万物云联网