摘要:AIDC概念板块的强转弱的利空情绪已经逐渐蔓延,原因在之前的文章中分析过:一个是前期涨幅过高,市场认为部分标的已经脱离基本面,标的估值短期偏高,需要年报和一季报来支撑下;另一个就是市场并未等到足够提振板块情绪的催化剂,反而等到了利空。上周高盛和阿里蔡崇信对算力
最近市场“算力过剩”的情绪漫天飞舞,不过依旧有细分领域表现强势!
AIDC概念板块的强转弱的利空情绪已经逐渐蔓延,原因在之前的文章中分析过:一个是前期涨幅过高,市场认为部分标的已经脱离基本面,标的估值短期偏高,需要年报和一季报来支撑下;另一个就是市场并未等到足够提振板块情绪的催化剂,反而等到了利空。上周高盛和阿里蔡崇信对算力建设利空的观点点燃了空头势力,实际上部分资金早在英伟达GTC大会和腾讯2025年在算力端保守的资本支出预算后就开始悄悄出逃了。接着美股英伟达(NVDA.O)的连续大跌也带崩了A股算力板块,当然“英伟达链”首当其冲,即使有些个股标的年报和一季报业绩好也并未幸免于难。
不过同为算力板块的另一端,国产ASIC正在迎来新的机遇。
01 算力板块熄火?算力芯片才是优先需求!
上周三盘后一个消息引起了市场关注。上海市发布了《上海市关于促进智算云产业创新发展的实施意见(2025-2027年)》,其中提出:到2027年,本市智算云产业规模力争突破2000亿元,云边端协同、产业链条完备的生态体系基本形成,并智算规模力争达到200EFLOPS,其中自主可控算力占比超70%。
这里有两个重要的关注点:一个就是到2027年上海智算云产业规模计划突破2000亿元;另一个就是智算规模计划达到200EFLOPS,其中国产算力占比超70%;(这个智算规模可以用当前的来参考下,据统计,截至2024年底,电信、移动全国范围智算规模分别35EFLOPS、29EFLOPS);其实在2024年年底上海曾经印发《关于人工智能“模塑申城”的实施方案》提出:到2025年底,全市智能算力规模突破100EFLOPS、本市新建智算中心国产算力芯片使用占比超过50%。超预期的方面是,本次方案相比前期算力规模翻了一倍到200EFLOPS;去年国产算力芯片使用占比是50%,今年提高到70%。
这里粗略计算一下,按照目前国内大厂主要抢购的英伟达H20算力卡来看,H20的FP16峰值计算能力为148Tflops,而200EFlops=2亿Tflops,那么对应的总需求为135万张左右,而当前市场上H20单卡的价格在13万元左右,按照这个价格来计算,要满足200EFlops的需求,对H20的需求价值空间在1755亿左右,当然这是理想状态,需求越高价格越贵,按理说H20的价格可能会比13万要高。那么如果按照上海市要求的70%的算力芯片由国产完成,那么对应的市场份额将在1228亿左右,还只是上海市的需求。
国产替代是一方面,另一方面英伟达的H20大概率会逐渐退出国内市场。这个在去年7月其实市场已经有预期了。2024年7月3日,国家发展改革委等部门关于印发《数据中心绿色低碳发展专项行动计划》的通知,其中对算力能耗提出了明确要求:要求新建及改扩建数据中心应采用能效通用图形处理器能效先进水平和节能水平14nm+芯片算力≥0.25TFlops/W,小于14nm芯片算力≥0.5TFlops/W。然而根据测算,属于14nm以下的H20单位能效算力仅为0.37TFlops/W(148/400W),远低于规定要求的0.5TFlops/W。
可见,这次不是大洋彼岸禁售H20,而是我们主动放弃这种“阉割”的产品。虽然实行的没有那么严苛,但根据《计划》来看,2025年年底新建和扩建都要按照这个标准来。这无疑是对国产算力芯片的一个长期利好。
目前国内算力芯片自主信心和紧迫性是在不断提升的,前期Deepseek的出现让很多国产的中低端算力芯片也能够派上用场,趋势来看,算力芯片国产替代的机会越来越好,而且中芯国际的不断突破可以自主生产算力芯片,随着扩产良率的提升。隔日A股市场也给了一定的反应,上周四国产ASIC概念板块出现了反弹,其中芯原股份(688521.SH)在上周四盘中创阶段新高,当天上午国产半导体板块也出现了难得的上涨。
由此来看,寒武纪营收仅12亿,却能4年10倍,芯原股份即使亏损也能给千倍的高估值背后的原因其实是国产算力芯片的无奈,这些标的确实是A股市场所稀缺的,市场愿意“赌”这些基本面暂时不佳的上市公司一个未来预期。
02 “村里的希望”芯原股份
芯原股份(688521.SH)最近的市场表现比较强势,最大的刺激可能是大厂自研芯片需求,看了很多调研记录,主要是由于字节针对ASIC芯片向芯原股份订购IP及设计服务。
据“小道消息”说:“字节的需求规模为25亿左右,50万颗,单价0.5万元,相当于在原有业务基础上增长一倍。目前已正式开始前道设计,预计年底前流片。“以上并未有官方消息认证,不作任何投资建议参考。
芯片IP处于芯片半导体产业链的上游,具有技术水平高、知识产权高度聚集,商业价值大的特点,是芯片设计的重要基础,IP授权类似于芯片行业的知识版权。IP提供商将其开发的芯片IP授权给芯片设计企业使用,授权方需要按照约定支付费用,并遵守相关的使用条款和限制。近些年,受制于海外的垄断限制,像前面提到的H20退出国内算力芯片市场的趋势下,国产芯片替代需求大增。
芯原股份是在2020年8月18日在科创板上市,2023年公司的芯片IP授权业务市场占有率为中国大陆第一、全球第八。这里虽然是全球前十,但IP nest,Synopsys和ARM在全球IP市场份额中合计占比依旧超过60%,芯原股份在内的国产芯片IP在全球市场份额仅为1.9%。当然市场更看重的是预期,当前的低份额才能给未来国产芯片IP的不断渗透带来更高的预期。
芯原股份的产品覆盖覆盖GPU/NPU/VPU/DSP/ISP全领域。其业务主要有两种商业模式:一个是芯片的IP授权;另一个则是一站式芯片定制服务,即ASIC业务。而“SiPaaS模式”作为公司核心竞争壁垒意味着:下游客户只需对接芯原一家公司,就能完成芯片从概念到成品的全过程,极大简化了供应链管理和沟通成本。使得从芯片设计到晶圆制造、封装和测试的全流程覆盖,还能提供系统平台解决方案。
根据最新的投资者关系调研记录来看。芯原的NPU IP已在82家客户的142款AI芯片获得采用,覆盖服务器、汽车、智能手机、可穿戴设备等10个市场领域;集成芯原NPU IP的AI类芯片已在全球范围内出货超过1亿颗,在嵌入式AI/NPU领域全球领先;此外,芯原用于高性能AI计算的GPU和GPGPU-AI IP还在全球范围内获得多次架构授权,在众多高性能计算产品中获得应用。
从分业务角度来看,相比于芯片设计和IP收费,芯原股份的芯片量产业务发展较快,2020年从6.56亿增长至2022年的12.07亿,由于2022-2023年是全球芯片产业的下行周期,芯原股份也无奈承受业务下滑,。2024年也是过渡期,芯片行业复苏在汽车电子和服务器的需求高增下正在进行中,市场也预期芯原股份的业绩将逐渐回暖。
按照目前芯原股份的业绩整体比较“难看”,不过业绩目前也不是市场预期的核心点。
关键在技术层面。在文章开头分析过国内的AI算力芯片将出现较大的供需缺口,英伟达的H20不符合最新的单位算力能耗,大概率会在今年后退出国内市场,而从H20的性能来看,它属于GPGPU的范畴,那就意味着国产GPGPU将填补这一空缺。芯原股份的GPGPU技术如何?
由于公开消息比较少,所以可能没那么准确,重点是逻辑。目前可以肯定的是,短期难有英伟达H20的完美替代品。
这里总结了一些目前为止芯原股份的产品,仅供参考。
严格意义上并没办法直接对比,奈何可参照标的确实不多,这里仅在某些方面将芯原股份的GPGPU-AI IP与英伟达的H20粗略对比下。在算力上,
GPGPU-AI IP的单核算力通过多簇扩展可以提升8-10倍且支持多核堆叠,在服务器级方案上FP16算力可以达到16-32 TFLOPS,但FP16英伟达H20的算力是148TFLOPS,算力上国产不占优;更多优势在能耗和成本上,这里参考2023年公司发布的Vivante 3D GPGPU IP。
补充下:Vivante 3D GPGPU IP是芯原GPU IP的基础架构,基于Vivante GPU研发经验,最初定位为通用计算加速(GPGPU),支持从嵌入式设备到服务器的广泛场景。而GPGPU-AI IP是在此基础上进一步整合AI加速模块(如Tensor Core)和优化软件栈形成的增强型产品线,实现GPGPU与AI计算的深度融合,例如支持大语言模型(LLAMA)、AIGC模型(如Stable Diffusion)等。据资料来看,Vivante 3D GPGPU IP的单位算力能耗在1-3TFlops/W,H20之前算过,单位算力能耗为0.37TFlops/W,这一块H20能耗确实不达标;
而且在成本上,芯原股份的模式是一次性收取IP授权费用,降低客户研发成本,支持中小算力配置(性价比高于全功能GPU),这一点更加亲民。不过,当前问题是GPGPU-AI IP主要更多还是边缘计算,优化结构后可以支持异构计算,而H20可以直接进行高性能计算,场景上显然不是一个维度。
不过这也是定制化的最大优势,芯原股份的IP方案支持从边缘端(如单核8-10 TFLOPS)到云端(多核扩展至32 TFLOPS)的定制化配置,适配更广泛;而H20作为固定算力芯片更适合标准化的超大型数据中心需求。
从客户方面来看,目前芯原股份40%收入来源于非芯片厂商,这里面有系统厂商、大型互联网公司和云服务提供商。其实这个逻辑不难理解,在Deepseek出现之后,大模型的开发门槛降低了。通过优化路径,即稀疏计算、模型蒸馏等方式,DeepSeek重构了大模型训练和推理的占比,机构推断,未来大模型的推理占比将达到70%,而推理端对AI芯片的算力要求并没有训练端那么严苛,这显著降低了对高端GPU的依赖,前面也分析过,H20也就在算力上还占据优势,而性价比对比国产ASIC必然大打折扣。
从机构调研来看,芯原股份的订单量也一直在保持增长。截至2024年末,公司订单情况良好,在手订单24.06亿元,较三季度末的21.38亿元进一步提升近13%,在手订单已连续五季度保持高位。这样订单充足的前提下,未来转化为业绩对基本面也就有所保证。
来源:新浪财经