寒武纪深度研究报告:国产 AI 芯片龙头的崛起与挑战

B站影视 欧美电影 2025-08-29 18:53 1

摘要:寒武纪(688256.SH)作为国内 AI 芯片领域的领军企业,正迎来前所未有的发展机遇。公司 2025 年上半年业绩实现爆发式增长,营收同比增长 4347.82% 至 28.81 亿元,归母净利润 10.38 亿元,成功实现扭亏为盈,标志着公司业务已进入规模

寒武纪(688256.SH)作为国内 AI 芯片领域的领军企业,正迎来前所未有的发展机遇。公司 2025 年上半年业绩实现爆发式增长,营收同比增长 4347.82% 至 28.81 亿元,归母净利润 10.38 亿元,成功实现扭亏为盈,标志着公司业务已进入规模化盈利阶段。截至 2025 年 8 月 27 日,公司市值突破 5800 亿元,股价盘中一度超越贵州茅台,成为 A 股 "股王"。

我们认为寒武纪的核心投资价值在于:

业绩拐点确立:公司已从长期 "高研发、高亏损" 状态中突围,2025 年上半年实现盈利和现金流双转正,标志着从技术投入期进入商业化收获期。产品竞争力提升:思元 590 芯片性能达到英伟达 A100 的 80%-90%,在推理场景能效比超越国际巨头,几乎支持所有国内主流大模型。公司持续迭代开发新一代智能处理器微架构和指令集,针对语言大模型、图像视频大模型等训练推理场景进行重点优化。国产替代加速:在美国对华芯片出口限制与英伟达 H20 停产背景下,寒武纪精准聚焦大模型算力赛道,云端智能芯片及配套产品踩中 "国产替代" 风口。生态建设成效显现:公司软件平台支持 PyTorch 最新版本,适配 DeepSeek 系列、Qwen 系列、Hunyuan 系列模型,软件生态逐步完善。

然而,公司仍面临客户集中度高、供应链风险、市场竞争加剧等挑战。截至 2025 年 6 月末,公司存货规模达 26.90 亿元,占总资产比例超过三成,存在一定库存压力。

我们对寒武纪的首次覆盖给予 "买入" 评级,基于公司在 AI 芯片领域的领先地位、业绩持续增长的确定性以及国产替代的大趋势。

寒武纪的技术基础可追溯至 2008 年,其前身是中科院计算所组建的 "探索处理器架构与人工智能的交叉领域"10 人学术团队。该团队由陈云霁和陈天石兄弟领衔,专注于处理器架构与人工智能的交叉领域研究。

2014 年,陈天石在中科大攻读博士期间,发表了 "DianNao" 系列学术论文,这些关于深度学习处理器的研究为 AI 芯片架构设计提供了新思路。2015 年,陈天石带领仅有 20 人的团队成功研发了全球首款深度学习专用处理器原型芯片,为寒武纪的成立奠定了坚实的技术基础。

"寒武纪" 这个名字来源于地质学上的 "寒武纪生命大爆发",寓意着希望用地质学上生命大爆发的时代来比喻人工智能的未来。

2016 年 3 月 15 日,依托中国科学院计算技术研究所的技术积累,陈天石和陈云霁兄弟创立了北京中科寒武纪科技有限公司。同年,元禾原点领投了寒武纪的天使轮融资,为其早期发展提供了重要的启动资金。

2017 年 9 月,华为在德国 IFA 展上发布了世界首款人工智能手机芯片麒麟 970,其中搭载了寒武纪 1A 处理器,并首次商用于华为 Mate10 手机。这一合作使寒武纪崭露头角,标志着 AI 产业迈出了重要的一步。2018 年,华为发布的麒麟 980 芯片继续使用寒武纪的 Cambricon-1B 处理器 IP,为寒武纪带来了可观的 IP 授权收入。

然而,2019 年华为发布了自研 "达芬奇架构"NPU 的麒麟 810 和 990 芯片,寒武纪失去了主要客户,被迫从 IP 授权模式转向独立芯片产品公司。这一转变对寒武纪的业务模式和发展战略产生了深远影响。

2018 年 5 月,寒武纪发布了中国首款云端人工智能芯片 MLU100 及其板卡,为视觉、语音等复杂场景的云端智能处理提供了重要支持。同年 6 月,寒武纪在 B 轮融资过后估值已经达到 25 亿美元,彼时,这家公司刚成立两年。

2020 年 7 月 20 日,仅用 68 天就火速通过科创板上市审核的寒武纪,头顶 "AI 芯片第一股" 的光环登陆科创板,开盘价 250 元较发行价暴涨近 300%。上市首日市值即突破千亿元,成为资本市场的焦点。

上市后,寒武纪继续保持快速发展的态势。2023 年 4 月成功完成定增,募资 16.72 亿元。然而,公司在市场竞争加剧和技术迭代的双重压力下,业绩一度承压。

2020 年至 2023 年,寒武纪归母净亏损累计超过 40 亿元。股价一路滑坡,在 2022 年 4 月跌至 46.59 元 / 股,较高点缩水超八成。很多人开始怀疑:寒武纪,会不会就这样沉寂下去?

真正的转折发生在 2024 年。这一年,寒武纪推出首款 7nm 云端训练芯片思元 590。实测显示,其整体性能达到英伟达 A100 的 82%,在某些特定任务中(如图像分类、自然语言处理)甚至可逼近 A100 的 90%。其 MLUarch05 架构支持多精度计算,内存带宽与互联接口较之前代有大幅提升。在推理场景能效比能比肩国际巨头,几乎支持所有国内主流大模型。

2024 年 12 月 31 日,寒武纪以 387% 涨幅夺得 2024 年股王称号,总市值近 2800 亿。这一阶段,寒武纪开始展现出强劲的增长势头。

2025 年第一季度,寒武纪实现营收 11.11 亿元,同比暴增 4230.22%;归母净利润 3.55 亿元,这是公司上市以来首次实现单季度盈利。2025 年上半年,寒武纪实现营业收入 28.81 亿元,较上年同期的 6476.53 万元大幅增长 4347.82%;归属于上市公司股东的净利润 10.38 亿元,归属于上市公司股东的扣除非经常性损益的净利润 9.13 亿元,较上年同期的 - 5.3 亿元、-6.09 亿元均实现扭亏为盈。

2025 年 8 月 21 日,英伟达突然宣布,其专供中国市场的 H20 芯片即刻停产。几乎同时,国产大模型公司 DeepSeek 发布新一代模型 DeepSeek-V3.1,宣布其采用了名为 "UE8M0 FP8" 的参数精度格式,并明确表示这项技术是 "针对即将发布的下一代国产芯片设计" 的。市场普遍解读这一信息与寒武纪密切相关,认为这意味着国产大模型与国产 AI 芯片的协同发展进入实质阶段。市场情绪瞬间引爆,寒武纪单日飙涨 14.67%,市值一日增长近 600 亿元。

2025 年 8 月 27 日,寒武纪股价盘中冲高至 1464.98 元 / 股,一度超越贵州茅台,成为新任 "股王",市值突破 5700 亿元。

寒武纪在人工智能芯片领域拥有多项核心技术,包括智能处理器指令集、智能处理器微架构、智能芯片编程语言、智能芯片数学库等。这些技术具有壁垒高、研发难、应用广等特点,为公司产品在市场上赢得了强大的竞争力。

公司掌握智能处理器指令集、智能处理器微架构的设计和开发,目前已经迭代到第五代处理器微架构 MLUarch05,用于最新一代云端训练芯片思元 590。寒武纪仍在迭代开发新一代智能处理器微架构和指令集,针对语言大模型、图像视频大模型、推荐系统大模型等训练推理场景进行重点优化,提升产品在性能、功耗上的技术指标,同时也将显著提升编程灵活性和产品易用性,以提升产品竞争力。

寒武纪凭借自研的 MLUarch 架构及指令集构建了核心技术壁垒,实现云边端统一架构与指令集兼容,有效降低开发者的应用迁移成本。其 MLUarch05 架构支持多精度计算,内存带宽与互联接口较之前代有大幅提升。

寒武纪已推出的产品覆盖了云端、边缘端的智能芯片及其加速卡、训练整机、处理器 IP 及软件,可满足云、边、端不同规模的人工智能计算需求。

云端产品线:主要提供云服务器中人工智能核心芯片及加速卡、训练整机等产品,满足云端大规模数据处理和模型训练的需求。云端产品线主要包括云端智能芯片及板卡、智能整机,具体产品包括思元 270 系列、思元 370 系列、思元 590 系列,及其组成的加速卡和玄思 1000 整机等。

思元 370 是寒武纪 2021 年发布的产品,其基于 7nm 制程工艺,是公司首款采用 Chiplet(芯粒)技术的 AI 芯片,集成 390 亿个晶体管,最大算力高达 256TOPS(INT8),是第二代产品思元 270 算力的 2 倍,适合分布式训练或推理任务。

思元 590 是寒武纪 2024 年发布的最新一代云端智能芯片,同样采用 7 nm + Chiplet 封装技术,芯片性能和能效比进一步优化,INT8 算力提升到 512TOPS,是思元 370 的 2 倍,定位云端训练 / 推理一体芯片,核心客户包括互联网云厂商、服务器厂商以及地方智算中心等。

边缘产品线:专注于边缘计算设备中的智能芯片及加速卡,适用于对实时性和低功耗有较高要求的场景,如智能家居、智能交通等。寒武纪的边缘产品线包括边缘 AI 加速卡 MLU220-M.2 等产品,面向低功耗易升级的边缘智能解决方案。

IP 授权及软件业务:包括将公司研发的智能处理器 IP 授权给客户使用,以及提供统一的平台级基础系统软件,打破不同场景之间的软件开发壁垒。

智能计算集群系统业务:将公司自研的加速卡或训练整机产品与合作伙伴提供的服务器设备、网络设备与存储设备结合,并配备公司的集群管理软件组成的数据中心集群,为客户提供软硬件整体解决方案。

寒武纪推出了 Cambricon Neuware 软件平台,试图构建自己的软件生态,但与英伟达 CUDA 相比仍存在明显差距。据报道,寒武纪砸下 16 亿做软件,试图把英伟达的护城河挖到自己脚下。

在生态方面,寒武纪训练软件平台持续跟进并支持了 PyTorch 最新版本,支持图融合和算子自动生成能力,取得了显著的性能加速效果,得到了客户的认可。支持了 Triton 3.0.x 全部原生特性,性能接近 Bang C 手写算子。

在算子优化方面,公司自主研发的 PyTorch 第三方算子加速库,针对大模型关键算子实现了专项优化,使推理平台的算子计算效率达到业界领先水平,发挥了产品性能优势。

在大模型方面,训练软件平台进一步扩展了对 DeepSeek 系列、Qwen 系列、Hunyuan 系列模型的支持,重点优化了通信计算并行方面的性能,提高了混合专家模型训练的整体吞吐。此外,公司还实现了 Transformers、Accelerate、DeepSpeed 社区原生支持 MLU,支持 Triton 3.0.x 全部原生特性,性能接近 BangC 手写算子。

寒武纪作为人工智能芯片领域的技术驱动型企业,持续保持高强度的研发投入。2025 年上半年研发投入达 4.56 亿元,较上年同期增长 2.01%,虽受营收大幅增长影响,研发投入占营业收入比例降至 15.85%,但投入绝对值保持增长,持续巩固技术壁垒。

截至报告期末,公司研发团队规模达 792 人,占员工总人数的 77.95%,其中 80.18% 的研发人员拥有硕士及以上学历。这一高比例的研发团队构成,为公司的技术创新和产品研发提供了坚实的人才基础。

专利方面,截至 2025 年 6 月 30 日,寒武纪累计申请的专利为 2,774 项。按照专利地域可分为:境内专利申请 1,783 项,境外专利申请 690 项,PCT 专利申请 301 项;按照专利类型可分为:发明专利申请 2,697 项,实用新型专利申请 40 项,外观专利申请 37 项。

寒武纪累计已获授权的专利为 1,599 项。按照专利地域可分为:境内专利 1,108 项,境外专利 491 项;按照类型可分为:发明专利 1,526 项,实用新型专利 37 项,外观设计专利 36 项。此外,寒武纪还拥有软件著作权 65 项;集成电路布图设计 6 项。

寒武纪的产品已在多个行业实现规模化部署,包括互联网、运营商、金融等重点行业。公司的产品应用主要集中在以下几个领域:

云计算与数据中心:寒武纪的云端智能芯片及板卡是云服务器、数据中心等进行 AI 处理的核心器件,其主要作用是为云计算和数据中心场景下的 AI 应用程序提供高计算密度、高能效的硬件计算资源,支撑该类场景下复杂度和数据吞吐量高速增长的 AI 处理任务。

人工智能大模型训练与推理:寒武纪的思元 590 芯片在自然语言处理、视频生成等场景实测性能达英伟达 A100 的 90%,能效比更优,适配文心一言、通义千问等主流大模型,支持 1700 亿参数模型高效运行。公司的训练软件平台进一步扩展了对 DeepSeek 系列、Qwen 系列、Hunyuan 系列模型的支持,重点优化了通信计算并行方面的性能,提高了混合专家模型训练的整体吞吐。

边缘计算与智能终端:寒武纪的边缘产品线适用于对实时性和低功耗有较高要求的场景,如智能家居、智能交通等。公司的边缘 AI 加速卡 MLU220-M.2 等产品,面向低功耗易升级的边缘智能解决方案。

行业解决方案:寒武纪的产品在金融、交通、能源、电力和制造等多个行业领域都有应用。在金融领域,公司不断加深与银行、保险公司及基金公司的业务探索,通过先进的算力架构,为金融行业的大模型训练与推理提供支撑,与头部客户共同推进大模型在典型业务中的适配优化与规模化落地,加速了大模型的行业应用。

在智慧矿山、智慧能源等垂直领域,公司深度携手业内核心企业,持续助力安全生产,聚力打造智能工厂,为传统行业设备装置的数字化、智能化升级提供人工智能产品支撑,有力助推企业向绿色智能示范标杆转型。

寒武纪的客户群体广泛,涵盖了互联网、金融、交通、能源、电力和制造等多个行业领域的企业。根据公开资料,寒武纪的典型客户包括:

互联网云厂商:寒武纪的思元 590 芯片已成为字节跳动等大厂的采购首选。市场消息称,寒武纪 2024 年向字节跳动交付了约 2 万 - 3 万片思元 590 芯片,预计 2025 年的出货量将增至 15 万片。

电信运营商:寒武纪曾和中国移动等组成联合体以 7.53 亿元中标浙东南数字经济产业园数字基础项目。中国移动曾披露,截至 2023 年 12 月,有 12 个省公司、超过 70 个 AI 业务完成寒武纪思元系列 AI 芯片的迁移。在运营商领域,寒武纪聚焦核心应用,持续提供深度优化的算力解决方案,保持客户业务场景的领先性与稳定性。

政府与公共事业:寒武纪的产品在政府项目和公共事业领域也有广泛应用。在智慧城市、智慧交通等领域,寒武纪的边缘 AI 芯片为智能监控、交通管理等提供了算力支持。

金融机构:寒武纪的产品在银行、保险公司及基金公司等金融机构得到应用,为金融行业的大模型训练与推理提供支撑。

寒武纪的产品在性能、能效比和适配性方面具有显著优势:

性能表现:思元 590 芯片整体性能达到英伟达 A100 的 80%-90%,在某些特定任务中(如图像分类、自然语言处理)甚至可逼近 A100 的 90%。其 MLUarch05 架构支持多精度计算,内存带宽与互联接口较之前代有大幅提升。

能效比:7nm 工艺的思元 590 芯片算力密度达 2PetaFLOPS,功耗降低 18%。在推理场景能效比能比肩国际巨头,几乎支持所有国内主流大模型。

适配性:寒武纪的训练软件平台支持了 PyTorch 最新版本,适配了 FSDP、SDPA、Inductor 和 MLU Graph 等重要功能。此外,公司还实现了 Transformers、Accelerate、DeepSpeed 社区原生支持 MLU,支持 Triton 3.0.x 全部原生特性,性能接近 BangC 手写算子。

价格优势:寒武纪的产品定价略低于其他国产主流 AI 芯片。据了解,目前寒武纪的思元 590 芯片售价约为 6 万 - 8 万元 / 枚,八卡服务器不超过 100 万元 / 台。相比之下,目前昇腾 910 系列八卡服务器约为 140 万元 / 台,昆仑芯三代八卡服务器约为 130 万元 / 台,阿里 APG 16 卡智算服务器约为 180 万元 / 台。

寒武纪 2025 年上半年业绩实现爆发式增长,各项财务指标均表现优异:

营收规模:2025 年上半年,寒武纪实现营业收入 28.81 亿元,较上年同期的 6476.53 万元大幅增长 4347.82%,营收规模实现量级突破。其中第二季度实现营收 17.69 亿元,环比增长 59.19%。

盈利能力:上半年,寒武纪归属于上市公司股东的净利润 10.38 亿元,归属于上市公司股东的扣除非经常性损益的净利润 9.13 亿元,较上年同期的 - 5.3 亿元、-6.09 亿元均实现扭亏为盈,标志着公司业务已进入规模化盈利阶段。第二季度归母净利润 6.83 亿元,环比增长 92.03%。

毛利率:2025 年二季度实现毛利率 55.88%,环比一季度略降 0.11 百分点,表明公司在收入放量阶段毛利率基本保持稳定,后续盈利水平有望得到保证。

现金流:经营活动产生的现金流量净额表现优异,本期实现 9.11 亿元,较上年同期的 - 6.31 亿元大幅改善,主要得益于销售回款的显著增加,反映出公司市场订单兑现能力及客户付款意愿显著提升,经营质量持续优化。

资产规模:截至 2025 年 6 月 30 日,公司总资产达 84.2 亿元,较上年末增长 25.34%。归属于上市公司股东的净资产为 67.55 亿元,同比增长 24.58%。

研发投入:2025 年上半年研发投入达 4.56 亿元,较上年同期增长 2.01%,虽受营收大幅增长影响,研发投入占营业收入比例降至 15.85%,但投入绝对值保持增长,持续巩固技术壁垒。

寒武纪目前在中国 AI 芯片市场处于第二至第三梯队的位置。根据国际市场调研机构 IDC 公布的 2024 年中国市场 AI 芯片出货量显示,英伟达出货量超过 190 万片,占比 70%;华为昇腾出货量超过 60 万枚,占比约 23%;百度昆仑芯 6.9 万枚、天数智芯 3.8 万枚、寒武纪 2.6 万片、沐曦 2.4 万枚、燧原 1.3 万枚,其他厂商的出货量均未过万。

伯恩斯坦在 2024 年 7 月一份名为《中国 AI 芯片供需状况》的研报指出,2024 年寒武纪在中国 AI 芯片市场份额 1%,位居第四,在英伟达(66%)、华为昇腾(23%)、AMD(5%)之后。

然而,随着国产替代加速,寒武纪的市场份额有望快速提升。伯恩斯坦预计,寒武纪 2025 年收入可能超过 100 亿元,几乎是 2024 年收入的十倍。该销售额在中国市场的份额将提升至 4%。

根据 TrendForce 集邦咨询研究,中国 AI Server 市场预计外购英伟达等芯片比例将从 2024 年约 63% 下降至 2025 年约 42%,而中国本土芯片供应商在国产 AI 芯片政策支持下,预期 2025 年占比将提升至 40%,几乎与外购芯片比例平分秋色。

寒武纪的股价在 2025 年表现强劲,创下历史新高:

年内表现:2025 年以来(1 月 1 日 - 8 月 27 日),寒武纪市值已上涨 116%。今年以来,其股价涨幅达 108.53%。

区间表现:自 7 月 10 日至今,寒武纪区间涨幅 156.47%。近一个月(7 月 28 日 - 8 月 27 日),寒武纪市值上涨 102%。

历史高点:8 月 27 日 13:38,寒武纪股价触及 1464.98 元 / 股,同期贵州茅台为 1460.93 元 / 股,这只 "狂飙" 一个半月的半导体明星股终于登上 A 股之巅。截至 8 月 27 日收盘,寒武纪股价报 1372.10 元,涨 3.24%。

市值规模:截至 2025 年 8 月 27 日收盘,寒武纪总市值达 5794 亿元。当日美国老牌芯片巨头英特尔市值 1077 亿美元(约合 7701 亿元)。按照这个数据计算,寒武纪市值约等于英特尔的 75%。

寒武纪作为国内 AI 芯片领域的领军企业,具有以下竞争优势:

技术领先:寒武纪在人工智能芯片领域拥有多项核心技术,包括智能处理器指令集、智能处理器微架构、智能芯片编程语言、智能芯片数学库等。公司已迭代到第五代处理器微架构 MLUarch05,用于最新一代云端训练芯片思元 590。

产品体系完整:公司已推出的产品覆盖了云端、边缘端的智能芯片及其加速卡、训练整机、处理器 IP 及软件,可满足云、边、端不同规模的人工智能计算需求。

国产替代机遇:在美国对华芯片出口限制与英伟达 H20 停产事件背景下,寒武纪精准聚焦大模型算力赛道,云端智能芯片及配套产品踩中 "国产替代" 风口。市场普遍预期,英伟达在中国原本高达 230 亿美元的收入规模将因 H20 停产而大幅缩水,而这部分空出的庞大市场份额,极有可能被以寒武纪为代表的国产 AI 芯片厂商所填补。

稀缺性:寒武纪是国内唯一一家已上市的 AI 芯片企业,是稀缺标的。华为昇腾、百度昆仑芯、阿里平头哥虽然也在提供 AI 芯片,但它们都没有上市。燧原科技、壁仞科技、摩尔线程、沐曦等和寒武纪几乎同期起价的 AI 芯片创业公司,目前又都处于 IPO(首次公开募股)阶段。

指数化投资推动:寒武纪被纳入上证 50、科创 50、沪深 300 等多个重要指数。相关指数基金需要按规则买入该股,这为其股价提供了稳定的资金支持。

寒武纪在 AI 芯片领域面临着来自国内外的多重竞争:

国际竞争对手

英伟达(NVIDIA):作为全球 AI 芯片市场的领导者,英伟达在技术、生态和市场份额方面都占据绝对优势。2024 年英伟达在中国 AI 芯片市场份额 66%,出货量超过 190 万片,占比 70%。然而,随着美国对华芯片出口限制的加强,英伟达在中国市场的供应面临不确定性。

AMD:AMD 在中国 AI 芯片市场份额 5%,位居第三。AMD 的 MI 300X 芯片总处理性能达 20918 TFLOPS,仅次于英伟达的 B300 和 B200。

国内竞争对手

华为昇腾:华为昇腾是寒武纪最强劲的竞争对手。华为昇腾系列芯片隶属于华为海思,2024 年在中国 AI 芯片市场份额 23%,出货量超过 60 万枚,占比约 23%。华为基于自己的 Ascend 系列 ASIC 构建 CANN 计算平台库。在以城市为主体的 AI 计算中心场景里,华为昇腾更是独占鳌头,坐拥 79% 的市场份额。

海光信息:海光是另一个强劲的竞争对手。海光 DCU(GPGPU)深算三号(7nm)显存带宽 1.6TB/s,Llama-70B 训练效率达 A100 的 92%。更重要的是,海光的 DTK 工具包兼容 CUDA 代码,迁移修改量小于 5%,比寒武纪有明显优势。2024 年海光 DCU 销量 28 万张(同比增 210%),国产训练卡市占率超 30%。在中国移动 2025 年招标中,海光份额达 41%,并获得字节跳动 5.8 亿元订单。

百度昆仑芯:百度昆仑芯在中国 AI 芯片市场份额较小,2024 年出货量 6.9 万枚,占比约 3%。百度昆仑芯 2 代 (R200) 的总处理性能为 2048 TFLOPS。

尽管面临激烈竞争,寒武纪仍具有以下竞争优势:

中立性:与华为昇腾相比,寒武纪作为中立的芯片供应商,不与阿里、腾讯等云厂商构成直接竞争,这使其成为部分企业的选择,公司也因此受益。

产品性能接近:寒武纪的思元 590 芯片整体性能达到英伟达 A100 的 80%-90%,在某些特定任务中(如图像分类、自然语言处理)甚至可逼近 A100 的 90%。其 MLUarch05 架构支持多精度计算,内存带宽与互联接口较之前代有大幅提升。

价格优势:寒武纪的产品定价略低于其他国产主流 AI 芯片。据了解,目前寒武纪的思元 590 芯片售价约为 6 万 - 8 万元 / 枚,八卡服务器不超过 100 万元 / 台。相比之下,目前昇腾 910 系列八卡服务器约为 140 万元 / 台,昆仑芯三代八卡服务器约为 130 万元 / 台,阿里 APG 16 卡智算服务器约为 180 万元 / 台。

生态建设进展:寒武纪的软件生态建设取得了积极进展。公司支持了 Triton 3.0.x 全部原生特性,性能接近 Bang C 手写算子。此外还实现了 Transformers、Accelerate、DeepSpeed 社区原生支持 MLU,支持 Triton 3.0.x 全部原生特性,性能接近 BangC 手写算子。

寒武纪在发展过程中也面临着诸多挑战与风险:

客户集中度高:寒武纪的收入严重依赖单一大客户。从历年财报来看,从 2020 年到 2024 年,寒武纪来自第一大客户的销售收入占比从 57.86% 一路攀升至 79.15%,2024 年已达到 9.30 亿元。2025 年上半年,寒武纪前五大客户应收账款和合同资产期末余额合计占总额的 85.31%。前五名客户的占比分别是 42.5%、18.0%、8.9%、8.4%、7.6%。

供应链风险:寒武纪采用 Fabless 模式,依赖台积电等代工厂,且公司及部分子公司已被列入美国 "实体清单",EDA 设计工具和先进工艺资源可能受到卡控。美国政府 2024 年末开始,限制台积电 16nm 以下 AI 芯片对中国代工。此后,寒武纪 AI 芯片主要依赖中芯国际的 7nm 工艺代工。

软件生态差距:英伟达的 CUDA 经过十多年发展,已成为全球 AI 开发的重要平台,据行业资料显示,全球近 90% 的 AI 软件开发依赖于此。而寒武纪的 BANG 语言与 CUDA 语法差异高达 40%。若要将一个 ImageNet 训练任务从 CUDA 迁移至寒武纪平台,开发者需重写近 80% 的底层算子,其训练效率可能仅为原来的 30%-50%,且调试时间成倍增加。

估值过高风险:Wind 数据显示,截至 8 月 27 日收盘,寒武纪动态市盈率达 514.42 倍,远超半导体产品 137.25 倍的中位值,同期海光信息、中芯国际的动态市盈率分别为 195.76 倍、178.33 倍。寒武纪曾明确公告,"预定大量载板订单、收入预测" 等热门信息为 "误导市场的不实信息",但未能阻挡投资者热情。

存货压力:2025 年上半年,寒武纪存货余额达到 26.9 亿元,较上年末增长 51.64%,占总资产比例超过三成。其中委托加工物资高达 15.31 亿元,表明公司采取了 "堆库存,锁产能" 的策略。

寒武纪将继续聚焦核心技术研发,加速大模型相关产品落地,深化行业合作与生态建设,推动人工智能芯片在更多场景的规模化应用。公司的技术研发战略主要包括:

下一代芯片研发:寒武纪正在迭代开发新一代智能处理器微架构和指令集,针对语言大模型、图像视频大模型、推荐系统大模型等训练推理场景进行重点优化,提升产品在性能、功耗上的技术指标,同时也将显著提升编程灵活性和产品易用性,以提升产品竞争力。

软件生态建设:寒武纪正在加大对软件平台的投入,拟投入 16 亿元用于 "面向大模型的软件平台项目",目标是进一步提升软件生态开放性与易用性。公司计划未来 3 年投入 450 亿元用于 AI 芯片及软件开发,彰显公司对研发和生成式 AI 的坚定投入。

算法优化:公司在训练软件平台方面,规划新功能和通用性支持,大力推进大模型预训练、强化学习训练等业务的支持和优化;在推理软件平台方面,公司持续推进推理软件平台的优化和迭代,在技术创新、产品能力和开源生态建设都取得重要成果。

寒武纪的产品与市场战略主要围绕以下几个方面展开:

产品线扩展:公司将继续丰富产品线,满足不同场景的 AI 算力需求。据市场消息称,寒武纪思元推训一体 690 芯片已经进入最后测试阶段,性能对标英伟达 H100 的 80%,有望成为国产最强算力载体。

行业渗透:寒武纪将继续拓展在互联网、运营商、金融等重点行业的应用,同时积极探索智慧矿山、智慧能源等垂直领域的应用机会。

市场拓展:公司将进一步加强市场开拓力度,拓展国内外市场,尤其是在国际市场上,与英伟达等国际巨头展开竞争。通过不断提升产品质量和服务水平,提高客户满意度,逐步扩大市场份额。

为支持公司的技术研发和业务拓展,寒武纪正在推进新一轮融资计划:

定增募资:寒武纪正在推进 2025 年度向特定对象发行 A 股股票事项,拟募集资金不超过 39.85 亿元,用于 "面向大模型的芯片平台项目"、"面向大模型的软件平台项目" 及补充流动资金。其中,芯片平台项目拟投资 29 亿元,旨在增强公司面向大模型的芯片技术与产品综合实力;软件平台项目拟投资 16 亿元,目标是进一步提升软件生态开放性与易用性。

股权结构优化:寒武纪在 2025 年 7 月中旬曾发布公告称,定增募集资金总额从不超过 49.8 亿下修调整为不超过 39.9 亿元。长江证券认为,寒武纪定增下修募资总额,股权稀释减少,顺利完成概率有望提升。

寒武纪高度重视生态建设和合作伙伴关系,主要战略包括:

开源生态:寒武纪积极参与开源社区,支持 Triton 3.0.x 全部原生特性,性能接近 BangC 手写算子。此外还实现了 Transformers、Accelerate、DeepSpeed 社区原生支持 MLU。

产学协同:公司积极支持多所高校开设基于寒武纪平台的人工智能课程,构建产学研一体化人才培养生态,为技术生态储备长效发展动能。

行业合作:寒武纪与 DeepSeek 等国产大模型公司建立了紧密的合作关系。2025 年 8 月 21 日,DeepSeek 发布新一代模型 DeepSeek-V3.1,宣布其采用了名为 "UE8M0 FP8" 的参数精度格式,并明确表示这项技术是 "针对即将发布的下一代国产芯片设计" 的。这一合作标志着国产大模型与国产 AI 芯片的协同发展进入实质阶段。

基于对寒武纪的全面分析,我们对寒武纪的首次覆盖给予 "买入" 评级。主要投资逻辑包括:

业绩拐点确立:公司 2025 年上半年实现营收 28.81 亿元,同比增长 4347.82%;归母净利润 10.38 亿元,同比扭亏为盈。这是寒武纪 2020 年上市以来首次实现半年度盈利,标志着公司业务已进入规模化盈利阶段。产品竞争力提升:思元 590 芯片性能达到英伟达 A100 的 80%-90%,在推理场景能效比超越国际巨头,几乎支持所有国内主流大模型。公司持续迭代开发新一代智能处理器微架构和指令集,针对语言大模型、图像视频大模型等训练推理场景进行重点优化。国产替代加速:在美国对华芯片出口限制与英伟达 H20 停产背景下,寒武纪精准聚焦大模型算力赛道,云端智能芯片及配套产品踩中 "国产替代" 风口。市场普遍预期,英伟达在中国原本高达 230 亿美元的收入规模将因 H20 停产而大幅缩水,而这部分空出的庞大市场份额,极有可能被以寒武纪为代表的国产 AI 芯片厂商所填补。生态建设成效显现:公司软件平台支持 PyTorch 最新版本,适配 DeepSeek 系列、Qwen 系列、Hunyuan 系列模型,软件生态逐步完善。高盛将寒武纪目标价上调 50% 至 1835 元,认为其受益于中国云计算资本开支大增和芯片平台多元化趋势。市场空间广阔:全球 AI 芯片市场规模预计将持续增长,寒武纪作为国内 AI 芯片领域的领军企业,有望充分受益于行业的快速发展,实现业绩的持续增长。

投资者在关注寒武纪投资机会的同时,也应当注意以下风险因素:

客户集中度高风险:寒武纪的收入严重依赖单一大客户,2025 年上半年,寒武纪前五大客户应收账款和合同资产期末余额合计占总额的 85.31%。如果核心客户采购放缓或项目交付出现问题,将对公司业绩产生重大影响。供应链风险:寒武纪采用 Fabless 模式,依赖台积电等代工厂,且公司及部分子公司已被列入美国 "实体清单",EDA 设计工具和先进工艺资源可能受到卡控。美国政府 2024 年末开始,限制台积电 16nm 以下 AI 芯片对中国代工。估值过高风险:截至 8 月 27 日收盘,寒武纪动态市盈率达 514.42 倍,远超半导体产品 137.25 倍的中位值。寒武纪曾明确公告,"预定大量载板订单、收入预测" 等热门信息为 "误导市场的不实信息",但未能阻挡投资者热情。存货减值风险:2025 年上半年,寒武纪存货余额达到 26.9 亿元,占总资产比例超过三成。如果市场需求不及预期,可能导致存货减值损失。行业竞争加剧风险:随着国产 AI 芯片市场竞争加剧,寒武纪面临来自华为昇腾、海光信息等国内厂商的竞争压力。此外,英伟达等国际巨头也在不断推出新产品,保持技术领先优势。技术迭代风险:人工智能技术发展日新月异,芯片技术也在不断更新换代。寒武纪需要持续投入大量资金进行研发,以保持技术的领先性。若公司在技术研发上稍有滞后,未能及时跟上行业发展的步伐,其产品可能会面临被市场淘汰的风险。八、未来展望

寒武纪的发展历程反映了中国 AI 芯片产业的演进过程。从实验室研究到商业化应用,从依赖 IP 授权到自主芯片研发,从持续亏损到规模化盈利,寒武纪的成长之路既充满挑战,也充满机遇。

未来,寒武纪将继续聚焦核心技术研发,加速大模型相关产品落地,深化行业合作与生态建设,推动人工智能芯片在更多场景的规模化应用。公司将把握 AI 前沿发展路线,推动技术和产品的迭代优化,以适应更多商业客户对智能计算的差异化需求,同时抓住 AI 技术开始进入各行业领域的战略机遇期,加大市场拓展力度。

寒武纪的名字源自地质学上的 "寒武纪生命大爆发",象征着生命的多样性和进化的飞跃。在人工智能领域,寒武纪也希望能够像寒武纪生命大爆发一样,推动 AI 技术的快速发展和广泛应用。

随着 AI 技术在各行业的深度渗透,算力需求将持续增长。寒武纪有望抓住这一历史机遇,实现从 "国产替代" 到 "自主创新" 的跨越,成为中国 AI 芯片产业的领军者。

然而,我们也应当清醒地认识到,AI 芯片产业的发展需要时间积累和持续创新,真正的技术进步需要扎实的研发投入和市场验证。寒武纪仍在爬坡,未来的路还很长。

风险提示:本报告中的信息均来源于公开资料,不构成任何投资建议。投资者据此操作,风险自担。

来源:财经大会堂

相关推荐