摘要:9月19日,上交所官网显示,上交所上市审核委员会定于9月26日审议摩尔线程首发事项。摩尔线程此次申请科创板上市,拟募集资金80亿元。摩尔线程成立于2020年,主要从事全功能GPU及相关产品的研发、设计和销售,致力于为 AI(人工智能)、数字孪生、科学计算等高性
9月19日,上交所官网显示,上交所上市审核委员会定于9月26日审议摩尔线程首发事项。摩尔线程此次申请科创板上市,拟募集资金80亿元。摩尔线程成立于2020年,主要从事全功能GPU及相关产品的研发、设计和销售,致力于为 AI(人工智能)、数字孪生、科学计算等高性能计算领域提供计算加速平台,是国内极少数兼顾图形渲染与AI计算的国产GPU公司。摩尔线程创始人兼CEO张建中,曾任英伟达全球副总裁、中国区总经理,在GPU行业深耕近二十年。
这家被业界誉为"中国英伟达"的科技企业,能否成功叩开科创板大门,不仅关乎其自身的发展,更将深刻影响着GPU国产替代的战略进程。
今天为大家解读一下GPU国产化的相关知识。
GPU的定义
GPU(Graphics Processing Unit,GPU),即图形处理器,是一种专门用于处理图形渲染和并行计算任务的可编程逻辑芯片,其核心特征在于采用大规模并行计算架构,通过数千个计算单元同时执行多线程任务。与中央处理器(CPU)的串行计算架构不同,GPU在矩阵运算、数据密集型处理等场景下效率可达CPU的数十倍至数百倍,构成现代算力基础设施的核心组件。
GPU在数字经济中的战略价值
GPU已从传统图形渲染领域拓展为人工智能训练推理、科学计算、数字孪生等关键领域的核心算力支撑。无论是智能制造的效率提升、自动驾驶的技术突破,还是精准医疗的模式创新,GPU的性能表现都成为推动产业变革的关键变量,对数字经济高质量发展具有基础性支撑意义。
当前全球GPU市场由英伟达、AMD等国际巨头主导,国内高端GPU对外依存度较高。在算力基础设施自主可控的国家战略背景下,发展国产GPU不仅是技术突破的需要,更是保障数字经济安全、推动产业转型升级的关键支撑。
国产GPU的应用领域
在数据中心AI场景中,壁仞BR200、华为昇腾920等芯片构建的智算集群,为千亿参数大模型训练、AI绘画及自然语言处理提供核心算力。专业图形领域,景嘉微JM9系列、摩尔线程MTT S80显卡凭借对OpenGL/Vulkan等API的兼容能力,广泛应用于CAD/BIM设计、GIS地理信息系统及国产化桌面终端,满足政务、军工等场景的图形渲染需求。
数据来源:行行查 | 行业研究数据库 www.hanghangcha.com
在边缘计算与物联网领域,寒武纪思元590、摩尔线程E300产品以高能效比优势,服务于智能驾驶、智慧城市的边缘推理任务;高性能计算场景中,海光深算1000 DCU与芯动科技GD2000 GPU,通过与CPU的协同优化,为高校、科研院所的科学计算、数值模拟提供稳定算力。
高端GPU芯片难在哪里?
1)架构设计的极致平衡:高端GPU芯片需在有限功耗下实现数千计算单元的高效并行调度,兼顾算力密度、内存带宽与数据流转效率,平衡图形渲染与通用计算双场景需求。
2)软件生态壁垒:高端GPU芯片需兼容CUDA等主流框架并构建自主工具链,解决应用适配成本高、生态覆盖不足的问题。
3)先进制程的突破:高性能芯片对7nm及以下先进制程、HBM显存封装等工艺要求严苛,国内制造环节仍存性能与产能瓶颈。
4)算力-带宽的优化:高算力需匹配高带宽显存与互联技术,避免数据传输成为性能瓶颈,同时需持续投入研发与顶尖人才储备,应对长周期、高投入的技术迭代挑战。
GPU产业链上游核心环节包括硅片、核心元器件、IP授权、制造设备与材料。硅片领域,沪硅产业12英寸硅片成为国产GPU芯片的基底支撑;核心元器件中,长鑫存储已送样HBM3并扩产,胜宏科技、沪电股份是高端GPU PCB核心供应商。IP授权方面,芯原股份提供GPU IP及设计服务,深度绑定本土厂商。制造设备里,中微公司刻蚀机突破亚埃级精度,北方华创覆盖多类关键设备;材料端,南大光电ArF光刻胶通过中芯国际验证,华特气体的特种气体加速国产替代。
中游是核心设计与制造环节,主导GPU技术与产品落地。设计端形成差异化竞争梯队,华为、景嘉微为领军企业,具备全栈研发能力;摩尔线程、壁仞科技则聚焦高端市场突破。制造环节除晶圆制造外,长电科技、通富微电在封装测试领域提供专业服务,保障芯片量产质量。
下游为系统集成与应用拓展环节,连接产业与市场。系统集成商浪潮、曙光推出基于国产GPU的AI服务器,2024年出货量大幅增长;应用端商汤科技、旷视科技基于国产芯片开发行业解决方案,科大讯飞等企业则将国产GPU应用于教育、医疗等场景,推动技术商业化落地。
参考摩尔线程招股书、弗若斯特沙利文数据,2020年至2024年全球GPU市场规模展现出显著的增长趋势,年均复合增长率高达62.4%。预计2025年全球GPU市场规模将达到15,000亿元。
参考摩尔线程招股书、弗若斯特沙利文数据,预计到2025年中国GPU市场规模将接近3,000亿元。中国AI智算GPU的市场规模已从2020年的142.86亿元迅速增至2024年的996.72亿元,期间年均复合增长率高达62.5%。根据弗若斯特沙利文预测,到2029年,我国AI智算GPU市场规模或将达到10,333.40亿元。此外,桌面级产品的市场规模未来有望保持稳定增长,从2020年的241.91亿元增至2024年的641.45亿元,预计2029年进一步增至3,302.38亿元。
在中国AI智算GPU市场中,数据中心GPU产品是过去增速较快的细分市场,其市场规模从2020年的82.00亿元以70.1%的年均复合增长率,快速增长至2024年的687.22亿元,预计未来还将以年均复合增长率55.7%的高增速增长至2029年的6,639.16亿元。
当前全球GPU芯片行业呈现出英伟达主导、AMD与英特尔加速追赶、中国厂商快速崛起的多元化竞争格局。英伟达凭借CUDA生态和技术迭代优势,在数据中心GPU市场占据92%的份额,并以94%的市占率垄断独立显卡市场。
中国GPU市场中,摩尔线程以全功能GPU覆盖数据中心和消费级双市场,成为国产领军者;海光信息凭借DCU芯片在AI加速卡市场深度绑定运营商与超算中心;景嘉微在军用领域市占率领先,并拓展信创桌面市场;壁仞科技、沐曦股份等聚焦高端AI训练。2025年GPU国产化率预计将超过30%,但高端市场仍依赖英伟达等国际巨头。
国产GPU厂商主要采用"全自研IP"与"混合IP"两种技术路线。全自研路径以华为昇腾为代表,从指令集到计算单元完全自主设计;混合路径如摩尔线程,通过授权ARM Mali GPU IP进行二次开发优化。具体来看各家厂商的技术与产品:
(1)摩尔线程:全功能GPU的国产化突破
摩尔线程聚焦“全功能GPU”赛道,是国内少数对标英伟达的企业。其核心是自研的MUSA架构,这是国内首个支持AI智算、图形加速、物理仿真协同的全功能架构,已迭代至第四代。摩尔线程的产品丰富,消费级有MTT S80显卡,性能对标RTX 3060;AI智算领域推出MTT S5000/S4000智算卡,构建的“夸娥”智算集群支持万卡扩展,千卡集群效率超国外同代产品;终端市场,“长江”SoC实现统一内存架构突破,E300边缘计算产品性能超越英伟达同代竞品。
(2)华为昇腾:AI算力的规模化引领
华为昇腾芯片以达芬奇架构为核心,专注AI训练与推理芯片,构建“芯片-集群-生态”的全栈解决方案,特点是算力密度高、集群扩展能力强。华为的昇腾920,FP16算力超900 TFLOPS,性能对标英伟达H20。配套推出的CloudMatrix 384算力集群,支持384片昇腾920互联,可为千亿参数大模型预训练提供稳定算力。
(3)寒武纪:AI加速芯片的专精之路
寒武纪的技术路线聚焦智能芯片,采用自研的思元(Cambricon)架构,主打AI推理与训练加速,特点是能效比高、硬件可编程性强,适配多类AI框架。寒武纪的思元590智能芯片,INT8算力较前代提升50%,支持PyTorch、TensorFlow等主流框架及千亿参数大模型推理。配套的思元加速卡已应用于智能驾驶、智慧城市等场景。
(4)景嘉微:图形GPU的国产化标杆
景嘉微以自主可控的图形处理为核心,长期深耕军用及国产化桌面GPU市场,侧重硬件架构优化与国产操作系统生态适配。最新代表产品为JM9系列GPU,延续了高性能图形渲染优势,支持OpenGL、Vulkan等主流图形API,适配银河麒麟、统信UOS等国产操作系统。该系列在CAD/BIM设计、GIS地理信息等专业领域表现突出,可满足政务、军工等场景的安全需求。
(5)海光信息:CPU-GPU协同的计算方案
海光信息的技术路线依托x86架构优势,侧重CPU与GPU(DCU)的协同计算,打造异构计算平台,核心是通过软硬件协同优化提升数据中心计算效率。最新产品为深算系列DCU,如深算1000,FP64双精度算力达20 TFLOPS,可与海光x86 CPU无缝协同。该产品主要面向科学计算、数值模拟等高性能计算场景,已在高校、科研院所实现规模化部署。
(6)龙芯中科:CPU-GPU协同的自主创新
龙芯中科技术路线以自主可控为核心,走CPU与GPU协同发展道路,通过自研GPU IP核实现硬件级整合,重点突破国产化图形渲染与AI推理能力。2025年最新产品包括2K3000处理器和首款独立GPGPU芯片9A1000,图形性能对标RX550,提供数十TOPS算力,主打低成本场景。
(7)芯原股份:GPU IP的专业化赋能
芯原股份技术路线聚焦图形GPU IP核研发,专注为终端设备提供超低功耗、高性价比的图形处理解决方案,核心优势在于硬件架构优化与多场景适配能力,服务于消费电子、物联网等领域。2025年4月推出的GCNano3DVG是其最新GPU IP产品,支持3D与2.5D混合渲染,专为智能手表、AI/AR眼镜等可穿戴设备设计,能满足紧凑型电池供电设备的动态图形渲染需求。
(8)芯动科技:高性能计算的硬核突破
芯动科技主打高性能通用计算GPU,采用先进制程工艺与创新架构设计,注重软硬件协同优化,目标对标国际高端GPU产品。其主力产品为“风华”系列GPU,代表型号GD2000采用多核心并行架构,支持光线追踪与AI超分技术,FP32算力达15 TFLOPS,已应用于专业图形工作站、数据中心加速等场景,性能接近国际同代中端产品水平。
(9)壁仞科技:高端AI算力的领军者
壁仞科技技术路线以自研BR架构为核心,专注高性能AI训练与推理GPU,特点是算力密度高、内存带宽大、集群扩展能力强。旗舰产品BR200智能芯片采用先进制程,FP16算力超500 TFLOPS,支持千亿参数大模型训练与推理,配套的BR200-X加速卡已批量应用于国内头部智算中心,与英伟达A100形成竞争,在AI绘画、自然语言处理等场景中表现突出。
(10)沐曦股份:全栈GPU的后起之秀
沐曦股份聚焦AI训练与通用计算GPU,采用自研GPGPU架构,兼容CUDA生态,打造“芯片-软件栈-计算平台”的全栈产品体系。核心产品MXC500 AI训练芯片采用7nm制程工艺,对标英伟达A100/A800,支持PyTorch、TensorFlow等主流框架,已完成芯片功能测试与基础平台验证;公司正推进该产品规模化落地,主要面向智能驾驶、工业AI等领域,2025年已启动科创板IPO进程。
国产GPU已完成从跟跑到突破的关键一跃。政策红利与市场需求形成双轮驱动,1200亿规模的赛道上,“芯片 - 架构 - 场景”的生态闭环正加速成型。虽仍面临生态适配、先进制程等挑战,但MUSA架构的兼容突破、广电等领域的落地验证,已照亮前行路径。随着国产替代从单点突破走向系统攻坚,2027年市占率超80%的目标渐行渐近,国产GPU终将筑牢数字经济的自主算力根基。
欢迎评论、点赞、收藏和转发! 有任何喜欢的行业和话题也可以查询行行查。
来源:行行查