摘要:一年前还深陷亏损漩涡的寒武纪,如今已成为国产AI芯片的领头羊,在这场国产AI芯片的替代潮中,谁是幕后的买家?
一年前还深陷亏损漩涡的寒武纪,如今已成为国产AI芯片的领头羊,在这场国产AI芯片的替代潮中,谁是幕后的买家?
01
国产AI芯片的崛起中国AI芯片市场正经历一场前所未有的供需变革,寒武纪从曾经的亏损巨头到如今净利润超10亿的行业翘楚,背后是互联网巨头们为争夺算力而展开的激烈采购竞赛。
2025年8月,寒武纪发布了一份令人震惊的中报:上半年营业收入28.81亿元,同比增长4347.82%;净利润达到10.38亿元,相比上年同期的亏损5.3亿元,实现了惊天逆转。
这位曾经的“亏损王”如今已成为中国AI芯片市场最炙手可热的供应商。股价从2024年初的不足百元一路飙升,突破千元大关,成为A股市场仅次于贵州茅台的第二只千元股,市值一度超过4000亿元。
回首过去,2025年中国AI芯片市场呈现出前所未有的需求爆发。据伯恩斯坦公司报告,2025年中国AI芯片需求预计达395亿美元,但供需之间存在25亿美元的缺口。
美国对英伟达H20芯片的销售禁令曾导致2025年销售额减少约168亿美元。虽然后来H20销售恢复,再加上新的B30芯片和AMD的供应,总供给约370亿美元,但仍无法满足全部需求。
这一供需缺口为国内芯片厂商创造了历史性机遇。预计到2027年,中国AI芯片市场的自主率将达到55%,远高于2023年的17%。
02
买家军团:互联网巨头领衔采购寒武纪背后的买家阵容堪称豪华,中国最主要的互联网巨头悉数在列。
2025年第一季度,字节跳动一家就贡献了寒武纪96.48%的营收,成为这家芯片企业绝对的核心客户。
字节跳动主要采购寒武纪的思元590和690芯片,用于抖音电商、AIGC多模态交互等场景。其边缘芯片思元220-M.2已嵌入TikTok智能推荐系统,在东南亚市场实现延迟降低30%。
阿里和腾讯也加入了采购寒武纪芯片的行列,但规模相对较小。阿里自2024年Q1起通过阿里云采购寒武纪芯片,占其订单量40%,主要用于大模型推理(如通义千问)和金融风控系统。腾讯则在混元大模型训练中测试思元690,与寒武纪合作开发“低成本训练套件”。
互联网企业采购寒武纪芯片的主要原因是:国产替代需求、成本优势和性能提升。同样算力的AI芯片,寒武纪售价25万元/片,而英伟达A100要75万元。
寒武纪2025年Q1核心客户构成分析
价格之外,性能需求匹配是互联网巨头纷纷转向寒武纪的关键。英伟达为规避出口管制推出的B30/B40芯片存在明显短板。B30仅支持8路互联,满足不了字节千亿参数模型的集群需求;B40的HBM容量仅24GB,远低于字节要求的48GB,多模态处理易卡顿。
技术适配更成为主要推手,DeepSeek-V3.1推出的优化版“UE8MOFP8”格式,通过去除8位数据中的“正负号位”,把算力消耗再降15%、单位能耗比提升20%。这种格式专门适配华为升腾与寒武纪690芯片。
面对市场刚需,寒武纪本身采用 Fabless模式,专注于芯片设计和研发,将晶圆制造委托给台积电、中芯国际代工,封装测试则委托给长电科技、通富微电等厂商完成。
2024年晶圆采购成本占营业成本的78%,表明寒武纪对上游供应商也有一定依赖性。产品方面,寒武纪提供“云-边-端”全栈解决方案:云端产品线占营收的99.40%,边缘产品线占0.56%,IP授权及软件占0.04%。而寒武纪的云端智能芯片MLU系列(如MLU370、MLU590)采用自主研发的MLUv02架构,具备强大的计算能力和高效的内存带宽,能够支持大规模的深度学习训练和推理任务。
03
供应链与产能保障交付能力寒武纪是国产AI芯片全栈技术龙头,其思元590芯片支持千亿参数大模型训练,适配DeepSeek-V3.1等开源框架,在国产大模型算力市占率超35%。
芯片行业不仅设计重要,生产能力同样关键。寒武纪在产能布局上也取得了显著进展。
通过与多家国内外知名晶圆厂合作,公司690芯片的产能正稳步释放,2025年预计能满足300亿订单的交付需求,彻底摆脱“有订单没产能”的困境。
2025年8月15日,寒武纪49.8亿元定向增发方案获上交所审核通过,创下科创板AI芯片企业单笔最大规模融资纪录。这笔融资将投入新一代智能处理器平台与全栈软件生态研发。
此次研发将采用chiplet异构集成方案,通过12nm+7nm混合封装突破制程限制。新一代思元芯片将集成高速互联模块,单卡算力密度较现行产品提升400%。
04
竞争格局:国内外厂商的角逐寒武纪崛起之路绝非一帆风顺,中国AI芯片市场呈现出“全球主导、本土崛起”的竞争格局,国内外厂商正在技术路线、生态建设和市场份额方面展开全方位角逐。
英伟达作为全球AI芯片领域的霸主,2025年市值达到4.44万亿美元,相当于31.8万亿人民币。
2025年上半年,英伟达营收834亿美元(约5973亿元人民币),利润409亿美元(约2929亿元人民币),毛利率保持在60.5% 的高位水平。
英伟达在全球AI芯片市场拥有92%的绝对份额,即便在中国市场,2025年预计仍占54%。其核心优势在于CUDA生态壁垒,这是一个包含编译器、开发库、API和工具链的庞大软件平台,拥有全球数百万开发者和海量成熟算法库。
AMD作为另一家国际巨头,在全球市场约占5%份额,虽远不及英伟达,但仍在不断推出竞争产品。
国内AI芯片市场已形成华为昇腾、寒武纪和海光信息三强争霸的格局。
华为昇腾凭借昇腾910系列芯片在服务器领域占据重要地位,市占率突破30%,主要供电信、国企及大型云服务商。昇腾910C性能达到英伟达H100的76%,2025年预计出货35万片。
寒武纪作为国产AI芯片全栈技术龙头,思元590芯片支持千亿参数大模型训练,适配DeepSeek-V3.1等开源框架,国产大模型算力市占率超35%。2025年二季度,公司营收28.81亿元,同比激增4347.82%,净利润突破10.38亿元。
05
技术路线专用与通用之争寒武纪与海光信息代表了国产芯片两条截然不同的技术路线。
寒武纪押注的是专用AI芯片赛道,其自主研发的MLU系列芯片专门针对深度学习场景优化。最新发布的MLUarch03架构,在处理Transformer模型时的能效比达到英伟达A100的1.6倍。这种聚焦特定场景的技术路线,正契合当前中国AI产业爆发式的算力需求。
海光信息走的是通用处理器路线,虽然市场空间更大,但面临着更激烈的国际竞争。一位行业分析师指出:“在x86生态里追赶英特尔、AMD,需要持续的技术迭代能力和生态构建能力,这对国产芯片企业是更大的挑战。”
资本市场正在用真金白银投票。寒武纪当前市销率(PS)高达35倍,远超海光信息的15倍。这种估值差异不仅反映了两家企业当前的成长性差距,更体现了投资者对AI专用芯片赛道更高的期待。
海光信息走的是通用处理器路线,通过获得AMD Zen架构授权,在服务器CPU市场与国际巨头正面竞争。其DCU加速卡虽然性能优异,但在AI训练场景的适配性上仍存短板。
06
点评生态建设与国产替代尽管面临挑战,寒武纪的未来发展空间仍然广阔。公司与中芯国际合作,14nm工艺良率提升,下半年月产能有望翻倍至3-4万颗,彻底扭转“有单无货”的困局。
技术方面,寒武纪新一代思元690测试反馈良好,产业化进程将成为关键催化剂。思元690的性能据称逼近英伟达H100的80%,在特定场景下成本较英伟达H20降低30%。寒武纪也在积极构建自己的软件生态,推出支持大模型训练的Megatron、Transformer Engine等组件,并优化MagicMind推理加速引擎。
这些举措类似于英伟达建立的CUDA技术生态体系,有助于形成技术护城河。
来源:壹零社