寒武纪首次实现季度盈利,国产AI芯片崛起中

B站影视 2025-02-24 20:31 2

摘要:经历了长期的投入与持续亏损,寒武纪终于实现上市以来首次单季度盈利。作为国内AI算力芯片的龙头,其发展历程几乎等同于国内AI芯片发展的缩影,随着寒武纪营收的逐渐放量,国内AI芯片或将步入快车道。胡楠/文寒武纪(688256.SH)披露2024年业绩预告,公司预计

经历了长期的投入与持续亏损,寒武纪终于实现上市以来首次单季度盈利。作为国内AI算力芯片的龙头,其发展历程几乎等同于国内AI芯片发展的缩影,随着寒武纪营收的逐渐放量,国内AI芯片或将步入快车道。

胡楠/文

寒武纪(688256.SH)披露2024年业绩预告,公司预计实现营业收入10.70亿元至12.00亿元,同比增长50.83%至69.16%。预计归属于母公司股东的净利润预计为-3.96亿元至-4.84亿元,与上年同期相比,亏损收窄42.95%到53.33%。

根据业绩预告的数据计算,2024年四季度,寒武纪营业收入约为8.85亿元至10.15亿元,单季度营业收入超过2023年全年水平,报告期内,公司实现归属于母公司股东的净利润约为2.40亿元至3.28亿元,首次实现单季度盈利。

作为国内AI芯片发展的缩影,寒武纪自成立以来一直专注于人工智能芯片产品的研发,先后成功研发思元270、思元290、思元370等多款智能加速卡产品。其中,寒武纪AI芯片思元590于2023年发布,采用ASIC架构,功耗低、效率高,几乎支持当前所有国内主流大模型,综合性能更是对标英伟达的核心产品A100。

算力基础设施建设加速

随着以ChatGPT为代表的人工智能浪潮爆发,大幅拉高了市场对AI服务器需求,全球头部云厂商持续加码AI算力基础设施投入,资本开支进入上行周期。作为AI服务器的核心,AI芯片市场规模也快速增长。

根据Fortune Business Insight和Mordor Intelligence数据,2024年,全球GPU芯片的市场规模由484亿美元增至653亿美元,预计2029年将达到2742亿美元,2024年至2029年复合增长率约为33.20%。

中国AI芯片市场也保持了较高的增速,根据亿欧智库数据,2024年,中国AI芯片市场规模约为1406亿元,预计到2025年,中国AI芯片市场规模将增至1780亿元。

美国政府为了遏制中国高新科技产业的发展,采取多种手段对中国芯片产业进行封锁。据国盛证券数据,早在2022年9月,芯片厂商AMD和英伟达就已经相继接到通知,要求对中国区的客户断供高端芯片。

2023年10月,美国商务部工业和安全局发布了针对芯片的出口禁令新规,针对中国半导体的制裁进一步升级。2024年1月29日,美国政府发布的监管文件中的“客户识别计划”要求美国云计算公司验证国外用户的身份,进而限制中国企业通过访问美国数据中心以训练人工智能模型。

在美国针对AI芯片管控的背景下,为了推动国产AI芯片的发展,国家先后出台了一系类扶持国产AI芯片发展的政策。

2023年12月,发改委等五部门共同发布《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》,提出到2025年底,东西部算力协同调度机制逐步完善,通用算力、智能算力、超级算力等多元化算力加速聚集,国家枢纽节点地区各类新增算力占全国新增算力的60.00%以上。

随着国家顶层政策号召与引导力度加强,北京、上海、广东、贵州等地方政府也纷纷出台相应政策,推动当地算力产业的发展。据长江证券研报,2024年3月,上海市通信管理局等十一个部门联合发布《上海市智能算力基础设施高质量发展“算力浦江”智算行动方案》,提出到2025年,上海市智能算力规模超过30EFLOPS,占比达到总算力的5成以上。

而且,智算行动方案还要求新建智算中心国产算力芯片使用占比超过50.00%,国产存储使用占比超过50.00%,服务具有国际影响力的通用及垂直行业大模型设计应用企业超过10家。

与此同时,国内三大运营商业陆续发布大额AI服务器采购项目,进一步强化了国产AI算力需求的确定性。以中国移动为例,根据其发布的《中国移动2024年至2025年新型智算中心采购招标公告》,公司将采购人工智能服务器7994台机配套产品用于智算中心建设。

值得一提的是,中国移动此次总中标金额约为191.04亿元,且项目公示的中标人全部为搭载了国产AI芯片的国产服务器厂商。

ASIC、GPU双向突围

AI芯片并非只有GPU一种,除了GPU之外,还包括ASIC与FPGA。不过,AI芯片绝大部分市场份额被GPU与ASIC所占据。公开信息显示,GPU的优势在于高并行结构,生态系统成熟,支持跨平台等。ASIC则是专门为深度学习计算定制的芯片,具有效率高,功耗小,体积小等优势。

据国泰君安研报,由于ASIC是为了特定任务而设计,减少了很多针对通用加速计算的不必要的硬件设计。因此,与GPU相比,ASIC成本明显降低。

在算力方面,ASIC单卡算力与GPU相比仍有一定的差距,例如,谷歌TPUv6和微软的Maia100算力约为英伟达H100的90.00%与80.00%。不过,谷歌TPUv6和微软的Maia100单价显著低于H100,故在推理场景中,ASIC更具有性价比。

据Marvell数据,2023年,定制芯片仅占数据中心加速计算芯片的16.00%,其规模约为66.00亿美元。随着AI计算需求的增长以及定制芯片占比的提升,预计2028年数据中心定制计算芯片市场规模将到429.00亿美元,2023年至2028年年均复合增长率为45.00%。

博通CEO对ASIC市场预计更为乐观,其在业绩说明会上表示,随着三大云计算厂商计划使用博通产品构建百万XPU集群,预计2027年博通AIASIC市场机会将在600.00亿美元至900.00亿美元。

因此,除了GPU之外,国内部分AI芯片厂商也根据自身禀赋选择ASIC方向进行突围,其中,寒武纪选择的就是ASIC路径。

据财报数据,寒武纪主要产品线包括云端产品线、边缘产品线、IP授权及软件、智能计算集群系统。其中,智能计算集群系统是公司的主要收入来源,2023年,该产品收入为6.45亿元,占当期营业收入的比重为85.46%。

寒武纪智能计算集群系统是将公司自研的加速卡或者训练征集产品与合作伙伴提供的服务器设备、网络设备与存储设备结合,并配备公司的集群管理软件组成的数据中心集群,其核心算力来源是公司自研的云端智能芯片。

据慧博投研,寒武纪思元100芯片是中国首款高峰值云端智能芯片。思元290是公司首款云端训练芯片,采用了7nm工艺,在4位和8位定点运算下,理论峰值分别为1024TOPS、512TOPS。思元370是寒武纪的第三代云端产品,采用7nm智能工艺的同时,还是其首款采用Chiplet技术的AI芯片。

值得一提的是,寒武纪AI芯片思元590于2023年年底发布,其采用ASIC架构,功耗低、效率高,几乎支持当前所有国内主流大模型,综合性能更是对标英伟达的核心产品A100。

与此同时,寒武纪也得到市场的青睐,2024年,其股价由95.85元最高涨至777.77元,总市值也一度突破3000亿元大关。

得益于GPU、CPU产品线,海光信息的业绩要好于寒武纪。2025年1月13日,海光信息(688041.SH)披露2024年年度业绩预告,预计2024年营业收入约为87.20亿元到95.30亿元,同比增长45.04%到58.52%;归属于母公司所有者的净利润为18.10亿元到20.10亿元,同比增长43.29%到59.12%。

对于业绩增长的原因,海光信息在业绩预告中表示,公司的CPU产品进一步拓展市场应用领域、扩大市场份额,支持了广泛的数据中心、云计算、高端计算等复杂应用场景。另外,在AIGC的时代背景下,公司DCU产品快速迭代发展,得到市场更广泛认可,以高算力、高并行处理能力、良好的软件生态支持了算力基础设施、商业计算等AI行业应用,进一步促进了公司业绩的较快增长。

海光信息DCU系列产品属于GPU,其以GPGPU架构为基础,兼容通用的“类CUDA”环境。因此,海光信息DCU主要部署在服务器集群或数据中心,支持高复杂度和高吞吐量的数据处理任务,以及全精度模型训练。

海光信息目前在售的DCU产品为深算一号与深算二号,深算三号正在研发中。另外,公司在投资者互动平台表示,深算二号具有全精度浮点数据和各种常见整型数据计算能力,性能相对于深算一号性能提升100%以上。

据财报数据,海光信息DCU已经实现LLaMa、GPT、Bloom、ChatGLM、悟道、紫东太初等为代表的大模型的全面应用,并与国内包括文心一言等大模型全面适配。

本文刊于01月25日出版的《证券市场周刊》

来源:大力财经

相关推荐