摘要:GTC 2025召开,英伟达重磅发布多款产品和技术,通过提升硬件性能和软件效率加速AI产业链落地;近期国内外模型加速迭代,覆盖多模态与推理等多种技术路径,高性能、低成本的特点有望促进端侧AI、通用/垂直应用的涌现;继阿里之后,腾讯、联通、移动相继发布24年报,
GTC 2025召开,英伟达重磅发布多款产品和技术,通过提升硬件性能和软件效率加速AI产业链落地;近期国内外模型加速迭代,覆盖多模态与推理等多种技术路径,高性能、低成本的特点有望促进端侧AI、通用/垂直应用的涌现;继阿里之后,腾讯、联通、移动相继发布24年报,且对于25年AI资本开支均相对乐观,将为AI产业链构建坚实底座。
GTC 2025召开,AI产业链持续繁荣
2.1 GTC 2025召开,Agentic AI时代已至
2025年3月19日,GTC 2025开幕,英伟达CEO黄仁勋发表主题演讲,重磅发布Blackwell Ultra服务器、Rubin下一代计算架构、Dynamo推理操作系统、CUDA-X全栈加速库、Groot N1人形机器人模型等一系列产品和技术,全面展示英伟达从硬件、软件到生态的AI全栈能力:
Agentic AI时代已至,推理需求持续爆发。AI已历经从“检索式”到“生成式”的过程,目前正向“自主式”发展。其中,自主智能(Agentic AI)具备多模态感知、逻辑推理和工具调用能力,将通过“思维链”(chain of thought)、“最佳N”(best of N)、“一致性检查”(consistency checking)等技术生成海量推理Token,计算量将至少达到过去的100倍(token消耗量增加10倍 X 计算速度也提升10倍)以上。以通用模型Llama3.3和推理模型DeepSeek R1对比为例,在面对复杂问题如“婚礼座位规划”时,推理模型生成的token超过8000个,是传统LLM模型不到500个的16倍。据黄仁勋预测,受推理模型驱动,AI数据中心建设投资将很快达到万亿美元规模。
Blackwell领衔能效革命,Rubin与CPO突破规模极限。硬件端,英伟达发布多项技术突破。其中,将于2025年下半年发布的Blackwell Ultra NVL72为AI推理时代专门定制,较前一代产品GB200 NVL72的AI性能提升了1.5倍。将于2026年推出的Rubin架构机柜则包括Vera Rubin NVL144和Rubin Ultra NVL576两个版本,FP4精度的推理算力分别达到3.6ExaFLOPS和15ExaFLOPS,为Blackwell Ultra NVL72的3.3倍和14倍。而在CPO领域,英伟达宣布了Spectrum-X和Quantum-X两款硅光共封芯片,以及对应的3款交换机产品,相比传统交换机能耗降低3.5倍,部署效率提升1.3倍,网络扩展弹性达到10倍以上。
Dynamo优化推理模型部署,CUDA-X加速全行业AI渗透。软件层面,英伟达积极推进推理模型部署、行业渗透和Agent落地。其中,Dynamo是专为推理、训练和数据中心加速构建的开源软件,能够作为AI数据中心的操作系统,通过动态资源分配、多级并行、KV缓存优化等多种技术,大幅提高计算效率。如果将Dynamo和最新Blackwell芯片搭配,同功耗下AI推理速度可以提高40倍。CUDA-X则是覆盖工业、通信、生物医药等不同垂直领域的软件加速库,助力千行百业AI落地。截止目前,CUDA开发者超600万,加速库及模型数量突破900个。此外,英伟达还展示了Llama Nemotron 系列推理模型,并推出AI Agent模板NVIDA AIQ,帮助开发者快速部署Agent。
Omniverse与Groot N1重塑物理AI。在具身智能领域,英伟达通过Omniverse数字孪生平台和Cosmos具身智能基础模型合成数据,创造虚拟环境,生成闭环训练,降低机器人开发周期。基于Omniverse+Cosmos的框架,英伟达微调训练了专用于人型机器人的开源基础模型Isaac GR00T N1,其采用双系统架构,分别用于快速反应和慢速思考,能够使机器人轻松地操纵常见物体并协同执行多步骤序列。目前,英伟达已经与Google DeepMind、迪士尼合作开发了Newton物理引擎,并将Isaac GR00T N1作为底座驱动了迪士尼BDX机器人的活动。此外,Omniverse+Cosmos还能够用于自动驾驶领域,帮助自动驾驶汽车更稳健地应对复杂场景。
我们认为,英伟达从硬件入手,逐步向行业软件生态和Agent切入,全面加速AI产业链发展,其中硬件性能提升+软件效率优化将为AI落地提供乘数效应。
2.2 国内外模型加速迭代,多模态与推理并进
DS爆火以来,国内外AI迭代进程仍在加速,本周Google、OpenAI、腾讯等大厂相继更新模型:
Google密集上线模型功能,优化用户体验。继开源Gemma 3-27B模型以超小尺寸击败DeepSeek v3、o3-mini等以来,Google连续上线模型性能。3月13日,谷歌正式推出集文本、图像、视频多模态生成能力于一身的Gemini 2.0 Flash Experimental模型,能够以语音描述要求模型进行修图、构图,还支持生成搭配插图的个性化故事;3月14日,谷歌免费开放个人AI研究助手DeepResearch功能,当用户提出问题后,模型会类似Agent对目标进行拆解、规划、搜索、输出,最终生成一篇完整的研究报告;3月17日,谷歌则上线Personalization功能,在用户登录谷歌账户后,Gemini能够根据用户的过往搜索记录,生成针对性、个性化的回答,将AI与搜索生态相结合。
OpenAI音频模型上新,助力用户构建语音Agent。3月21日,OpenAI 宣布在API中推出全新音频模型,包括语音转文本模型gpt-4o-transcribe及其mini版本,以及文本转语音模型gpt-4o-mini-tts。其中,两款语音转文本模型在 FLEURS 多语言基准测试中的表现超越了现有的 Whisper模型,尤其在英语、西班牙语等多种语言上表现突出,transcribe定价与Whisper保持一致($0.006/min),mini价格减半($0.003/min);而文本转语音模型则支持开发者预设多种语音风格,定价每分钟0.015美元。直播上,OpenAI 还展示了通过音频模型构建的AI Agent案例,当用户询问最近订单时,系统做出流畅回应并准确提供了订单号。
腾讯混元推出深度思考模型T1正式版。3月21日晚,腾讯推出自研深度思考模型混元T1正式版,并在腾讯混元和腾讯云官网开放体验。性能方面,混元T1 在MMLU-pro、CEval、AIME、Zebra Logic等中英文知识及竞赛级数学、逻辑推理的公开基准测试中,达到业界领先水平;成本方面,混元T1沿用了Turbo S的创新架构,全球首创将Hybrid-Mamba-Transformer融合模式无损应用到超大规模推理模型中,让企业和开发者以更低的投入即可实现高效的AI部署。受此技术推动,混元T1云上API输入价格为1元/百万tokens,输出价格为4元/百万tokens,低于DeepSeek-R1。此外,据腾讯云公众号,混元T1即将在腾讯元宝灰度上线,进一步构建腾讯自身AI应用生态。
我们认为,模型的加速迭代正是AI产业落地的前兆,高性能、低成本的模型有望促进端侧AI、通用/垂直应用的涌现,从而为用户带来更丰富,体验更佳的AI产品。
2.3 大厂与运营商资本开支持续,AI浪潮未来已来
阿里巴巴2月发布财报,并宣布“计划未来三年将投入至少3,800亿元人民币,用于建设云计算和AI的基础设施”,引发市场对AI资本开支的想象。本周腾讯、联通、移动相继公布业绩,均对AI战略做出部署:
腾讯:AI战略进入重投入期,24Q4资本开支超过阿里。3月19日,腾讯控股正式发布2024年第四季度及全年业绩报告,2024年全年收入为6602.57亿人民币,同比增长8%,净利润为1940.73亿人民币,同比增长68%;第四季度收入为1724.46亿,同比增长11%,净利润为513.24亿人民币,同比增长90%。
资本开支方面,腾讯24Q4资本开支为365.78亿元,环比增长114%,同比增长386%,超过阿里同期资本开支318亿元;2024年全年资本开支为767亿元,同比增长221%,创历史新高,同样超过阿里同期资本开支725亿元,其中AI相关研发投入为707亿元。年报媒体沟通会上,腾讯管理层计划在2025年进一步增加资本支出,预期资本支出占收入的比例为低两位数百分比(24年资本支出占收入比重约12%)。
中国联通:全面拥抱人工智能,算力投资预计同比增28%。3月18日,中国联通公告2024年报,实现营收3895.89亿元,同比增长4.6%;实现归母净利润90.29亿元,同比增长10.5%。中国联通2024年资本开支为613.7亿元,同比下降17%。其中,算力投资逆势同比上升19%。中国联通预计,2025年固定资产投资在550亿元左右,其中算力投资同比增长28%;此外,公司还为人工智能重点基础设施和重大工程专项作了特别预算安排。
中国移动:25年算力资本开支373亿元,推理算力投资不设上限。3月20日,中国移动公告2024年报,实现营收10408亿元,同比增长3.1%;实现归母净利润1384亿元,同比增长5.0%。2024年,中国移动智算规模达到29.2EFLOPS,净增19.1EFLOPS,呼和浩特、哈尔滨万卡级超大规模智算中心上线提供服务;公司计划2025年通算规模(FP32)累计达到8.9 EFLOPS,智算规模(FP16) 超34 EFLOPS。而在当日举行的业绩说明会上,执行董事兼首席执行官何飚进一步介绍,2025年中国移动在算力领域的资本开支将为373亿元,占比将提升至25%,其中年报公布的超34 EFLOPS智算计划主要以预训练资源为主,而对推理资源投资不设上限。
我们认为,大厂及运营商算力基础设施资本开支有望持续,从而为AI产业链搭建坚实的算力底座,促进模型快速迭代,以及应用生态的繁荣。
总结:GTC 2025召开,英伟达重磅发布多款重磅产品和技术,通过硬件性能提升和软件效率加速AI产业链落地;近期国内外模型加速迭代,高性能、低成本的特点有望促进端侧AI、通用/垂直应用的涌现;继阿里之后,腾讯、联通、移动相继发布24年报,且对于25年AI资本开支均相对乐观,将为AI产业链构建坚实底座。
(1)宏观经济下行风险:计算机行业下游涉及千行百业,宏观经济下行压力下,行业IT支出不及预期将直接影响计算机行业需求;(2)应收账款坏账风险:计算机多数公司业务以项目制签单为主,需要通过验收后能够收到回款,下游客户付款周期拉长可能导致应收账款坏账增加,并可能进一步导致资产减值损失;(3)行业竞争加剧:计算机行业需求较为确定,但供给端竞争加剧或将导致行业格局发生变化;(4)国际环境变化影响:国际贸易摩擦加剧,美国不断对中国科技施压,对于海外收入占比较高公司可能形成影响。
应瑛:中信建投证券计算机行业首席分析师,伦敦国王学院硕士,5年计算机行业研究经验。2021年加入中信建投,深入覆盖医疗信息化、工业软件、云计算、网络安全等细分领域。
来源:点滴财学