国产GPU独角兽摩尔线程正式登陆A股:一场改写算力格局的突围之战

B站影视 欧美电影 2025-11-13 21:34 1

摘要:摩尔线程披露首次公开发行股票并在科创板上市招股意向书,发行人股票简称为“摩尔线程”股票代码为“688795”,该代码同时适用于此次发行的初步询价及网下申购。此次发行网上申购代码为“787795”。此次公开发行股票总数为7000万股,占发行后总股本的比例为14.

根据最新消息:摩尔线程披露首次公开发行股票并在科创板上市招股意向书,发行人股票简称为“摩尔线程”股票代码为“688795”,该代码同时适用于此次发行的初步询价及网下申购。此次发行网上申购代码为“787795”。此次公开发行股票总数为7000万股,占发行后总股本的比例为14.89%。初始战略配售数量1400万股,占拟发行数量比例20%。

首次公开发行股票初步询价日为11月19日,申购日为11月24日。至此,摩尔线程这只国产GPU赛道的独角兽正迎来资本市场的关键考验!

01

公司的诞生

与技术突围之路

摩尔线程的诞生,始于一场关乎中国算力安全的 “破局之战”。

2019年芯片断供危机爆发,时任英伟达全球副总裁的张建中亲眼目睹中国 AI 算力对进口芯片的完全依赖。这成为他59岁毅然辞职创业的直接导火索。

这位在英伟达任职15年、从中国区总经理一路升至全球高管的行业老兵,放弃了百万美元年薪和稳固的职业前景,顶着 “叛徒” 的质疑和家人的反对,拿出全部积蓄投身创业。

可以说,没有英伟达,就不会有摩尔线程的创立。

摩尔线程所走的路线正是英伟达曾经走过的。若摩尔线程冲刺IPO成功,A股“中国版英伟达”这一炒作逻辑的最“正统”标的或将诞生!

2020年6月,摩尔线程在北京悄然成立。凭借多年积累的行业人脉,张建中创造了一个行业奇迹:仅用30天就组建起一支由英伟达、AMD、英特尔等巨头核心工程师组成的初创团队。创业初期的办公条件极为简陋,研发与行政人员挤在狭小的办公室里,团队成员几乎每天工作到深夜,却没人叫苦。

他们心里都清楚,自己正在做的是 “让中国拥有自主可控高性能 GPU” 的大事。

成立仅100天,摩尔线程就完成两轮融资,估值直接突破10亿美元,成为 GPU 行业史上成长最快的 “独角兽”。

截至2023年底,公司累计融资超 65亿元,投资方名单星光熠熠:红杉中国、五源资本连续多轮加注,字节跳动、腾讯、小马智行等科技巨头纷纷入局,其中小马智行更是将唯一的公开投资名额给了摩尔线程,足见行业对其技术路线的认可。

GPU行业向来以 “高投入、长周期、高技术壁垒” 著称,而摩尔线程用四年时间完成四次架构迭代,创下了国产芯片的研发速度纪录。其核心竞争力源于自主研发的 MUSA 统一系统架构,这一架构打破了国际巨头的技术垄断,实现了 “一颗芯片支持全场景计算” 的核心目标。

架构迭代的关键里程碑:

2021 年 “苏堤” 架构:作为摩尔线程的开篇之作,实现 FP32 算力 5.2TFLOPS,支持 DirectX 11,成为国内首款具备实用价值的全功能 GPU 芯片,结束了国产 GPU “有其名无其实” 的尴尬局面。
2022 年 “春晓” 架构:晶体管数量飙升至 220 亿个,FP32 算力提升至 15.5TFLOPS,图形渲染能力较上一代提升 3 倍,首次支持 DirectX 12,成功切入云桌面、视频云等商业场景。
2023 年 “曲院” 架构:FP16 算力突破 102TFLOPS,实现千卡级集群部署,标志着摩尔线程正式进入 AI 智算领域,为大模型训练提供了国产算力选项。
2024 年末 “平湖” 架构:堪称国产 GPU的里程碑式突破,新增 FP8 高精度支持,片间互联带宽提升3倍至 800GB/s,最大显存容量达 80GB。尤为关键的是,其张量计算引擎效率达到 98%,超过英伟达 H100 的91%,在核心性能指标上首次接近国际先进水平。

产品矩阵的全面落地:

依托四代架构,摩尔线程构建了覆盖 AI 智算、图形加速、智能 SoC 三大领域的产品体系。其中 2025 年上半年,AI 智算产品贡献了 6.65 亿元营收,占总营收的 94.85%,同比增长 229%,成为绝对主力业务。截至 2025 年中,公司已销售 8 套 AI 智算集群,其中包括 1 套最先进的 “平湖” 集群,正在洽谈的项目合同金额超 17 亿元。

在智能 SoC 领域,摩尔线程推出的 “长江” SoC 产品,INT8 算力达 50TOPS,性能规格超越高通骁龙 8295 方案,预计 2026 年实现量产,将率先应用于智能座舱场景。而在图形加速领域,MTT S1000、S2000、S3000 等产品已实现量产,其中 MTT S2000 采用 12nm 制程,4096 个 MUSA 核心,单精度算力 12TFlops,支持 AV1 编解码,成为国内数据中心的主流选择。

GPU的竞争本质是生态的竞争,而国际巨头凭借 CUDA 生态垄断行业数十年。摩尔线程从成立之初就确立了 “产品与生态双轮驱动” 的战略,自主研发的 MUSA 生态正逐步打破这一垄断格局。

生态建设的三大核心举措:

1)兼容性突破:推出 MUSIFY 工具包,实现 CUDA 代码向 MUSA 平台的低成本迁移,迁移工作量降低 90%。目前已完成对 PyTorch、TensorFlow、PaddlePaddle 等主流 AI 框架的原生支持,兼容超 150 家行业软件,大幅降低客户迁移成本。

2)开源共建:将核心算子库、融合算子库等关键组件开源,在 Gitee 上线 “摩尔线程” 与 “摩尔学院” 两大社区,累计开发数百个开源算子,吸引海量开发者参与生态建设。2025 年 GOTC 大会上,公司宣布全功能 GPU 原生支持开源生态,进一步扩大合作版图。

3)联盟共建:联合中国移动、中国电信、联想、360、飞桨等企业和机构,成立 “PES-KUAE 智算联盟” 和 “大模型生态联盟”,构建从算力基础设施到模型应用的全链条生态。同时与上海交通大学、浙江大学等顶尖高校开展产教合作,通过摩尔学院平台提供全栈式课程培训,系统化培育 GPU 开发人才。

截至 2025 年,摩尔线程已构建起广泛的产业生态网络,合作伙伴包括铜牛信息、东华软件、科大讯飞、当虹科技等多家上市公司。在教育领域,与科大讯飞共建的 AI 教育实训基地已在江苏锡山高级中学启用;在医疗领域,与东华软件合作开发的 AI 医疗平台实现落地;在算力服务领域,与中联数据、数道智算等企业共建的 KUAE 智算中心正式揭牌,提供从集群部署到模型服务的一体化解决方案。

02

全球市场格局

与国内GPU核心公司

一、全球市场:

1.英伟达(NVIDIA)

占据全球独立显卡市场94%份额,数据中心GPU出货量占比超70%。

H20(3nm工艺)、H100(5nm)支撑AI训练,CUDA生态开发者超500万,覆盖90%以上AI模型。

通过DGX Cloud云服务锁定大客户,2024年营收超800亿美元,研发投入占比22%。

2.AMD(Advanced Micro Devices)

独立显卡占6%,数据中心GPU不足15%,MI300X性能接近英伟达H100,但生态薄弱。

采用Chiplet封装和HBM3E显存,ROCm开源生态支持PyTorch等框架,2025年Q2出货量同比增长4.7%。

3.英特尔(Intel)

核显占PC市场61%,独显不足1%,Arc A770性能对标AMD RX 6600 XT,驱动优化仍待提升。

联合台积电开发20A工艺,OneAPI生态吸引开发者,计划2026年推出Battlemage架构独显。

二、国内市场:

去年以来,包括摩尔线程在内的国产GPU“四小龙”(摩尔线程、壁仞科技、燧原科技、沐曦)先后开启了IPO(首次公开募股)之路,截至目前进展各不相同。

国内GPU市场规模2024年达1638亿元,预计2029年突破1.3万亿元,国产化率目标提升至40%以上。核心玩家分为三类:

1.全功能GPU领军者

摩尔线程:

产品覆盖消费级(S80对标RTX 3060)、智算(夸娥万卡集群),兼容CUDA生态,2024年估值超240亿元,拟科创板上市。

MT Mesh 2.0架构支持千卡集群,与智谱AI合作训练千亿参数模型。

壁仞科技:

BR100芯片(7nm)算力512 TFLOPS(BF16),接近英伟达A100,光互连技术将集群延迟降至单机水平,获中国移动/电信订单。

BIRENSUPA™平台适配100+AI模型,2025年估值155亿元,港股上市筹备中。

燧原科技:

专注云端AI算力的国产领军者,以ASIC架构实现训推一体芯片突破,第四代L600芯片性能超越英伟达H20,支撑庆阳万卡推理集群(PUE≤1.1)和腾讯会议等千亿级场景,2025年估值202亿元,腾讯连续六轮领投。

HW昇腾:

昇腾910B(7nm)FP16算力320 TFLOPS,能效比优于A100,支撑南京政务云、九江医院AI应用,2025年AI芯片市场份额预计达25%。

全栈生态:CANN+MindSpore覆盖从芯片到模型全链条,开发者超100万。

2.细分领域突破者

景嘉微:

JM9系列军用市场占有率超90%,性能接近GTX 1050,正拓展信创桌面市场,2024年营收同比增长7.95%。

沐曦:

曦云C500(7nm)FP32算力15 TFLOPS,支持液冷散热,已交付万卡集群用于自动驾驶训练,兼容CUDA生态降低迁移成本。

海光信息:

深算系列DCU兼容“类CUDA”,性能较一代提升100%,国家超算中心订单占比超70%,2024年营收增长62.5%。

3.新兴势力与特色厂商

上海砺算:

7G100系列(6nm)对标RTX 4060,AI生成速度3秒/图,获腾讯、比亚迪订单,2025年Q4量产,估值42.1亿元。

TrueGPU架构支持光追,与东芯股份协同开发“存储+计算”方案,降低功耗20%。

天数智芯:

天垓100(7nm)支持200+AI模型训练,智铠100推理芯片兼容CUDA,服务清华、智源等机构,订单超5亿元。

摩尔线程供应链梳理:

来源:金融梦想家一点号

相关推荐