DeepSeek的隐喻: GPU失其鹿,ASIC、SOC们共逐之

B站影视 欧美电影 2025-04-01 16:54 1

摘要:开源模型DeepSeek的率先冲线,标志着“机器智能寒武纪时刻”的启动,产业即将因此进入应用创新大爆发周期。这一趋势所隐含的一重必然逻辑还在于:2025年,将成为AI推理之年,GPU失其鹿,ASIC与SOC们共逐之。

开源模型DeepSeek的率先冲线,标志着“机器智能寒武纪时刻”的启动,产业即将因此进入应用创新大爆发周期。这一趋势所隐含的一重必然逻辑还在于:2025年,将成为AI推理之年,GPU失其鹿,ASIC与SOC们共逐之。

01

低成本多模态是AI终端爆发的起点

1.AI是最新的交互方式,端侧AI的交互基础将是多模态模型

把握科技终端产品发展规律的线索之一是交互方式。回想古早时期的电脑,还需要靠直接输入机器语言指令来操作,应用范围极其有限;直到1984年,苹果推出了划时代的Macintosh计算机,靠图形用户界面和鼠标操作方式,让电脑变得前所未有的简单易用。下一个划时代交互方式的变革发生在智能手机的诞生,手指触控这种更高效的方式替代了鼠标,前者将我们推向了移动互联网时代,即使后面的云计算革命,也只是移动互联网时代的延伸。

AI,也可以视为对交互模式的一种底层创新:多样性和不确定性的输入,依托训练好的基座大模型,配合优质的端侧模型,输出最优反馈。从指令式进阶到智能化。第一个出圈的产品是Chatbot,但其局限在大语言模型LLM。而为了追求通用人工智能(AGI),未来输入和输出一定都是多模态的,如此才符合与终端使用者交互的需求。随着AI多模态大模型逐渐成熟,2025 年开始会涌现更多综合性多模态交互,将深度结合数据集、文本、音频、视频等实现更高维度的人机交互层级。被畅想超过十年的AIOT,也将可能第一次迎来爆款产品潮。

2.DeepSeek意外加速低成本、低功耗的到来

训练时追求Scaling law。但即使财大气粗的美国大厂再不关注成本,仅现在改造全球一年出货量1000多万台的服务器,年投入量就高达数千亿美元以上了。而推理时代无疑要将所有的智能终端都AI化,手机、耳机、电视、电脑、音箱、家电……合计年出货量接近30亿台,如果仍然是高成本改造,要投入的天文数字显然是完全不可行的。

国产开源模型DeepSeek V3横空出世,在其工程技术创新中,用到的多头潜在注意力(MLA,Multi-Head Latent Attention),成为其降低推理成本的关键,MLA大幅优化了Transformer架构中的KV Cache机制,显著减少了推理过程中所需的硬件资源,从而降低了推理成本。对产业链的意义在于,优质开源模型降本速度如此之快,靠这些模型蒸馏出来的小模型,将加速推理时代的到来:模型能力平民化,部署成本大幅降低。多模态AI为基础,低成本实现普惠,数十亿量级的智能终端,终将见到全面AI化的可能。

▲NVIDIA 推出高性价比的生成式 AI 超级计算机

3. 已经有了令人振奋的探路式新产品——眼镜

AI+低成本,将带动硬件爆发的推论并非臆测。2024年初,被市场寄予厚望的苹果头戴式产品MR遭遇滑铁卢,事后来看失败的原因是没有基于AI交互、成本还高昂,等于是捅了自己两刀。意外成功的却是不被人关注的Ray-Ban Meta眼镜,2024年发售销量突破200万副,显示了AI与传统眼镜结合后显现的巨大市场潜力,另外值得一提的是,这款眼镜的售价只有MR的不到十分之一。

02

芯片角度,ASIC和端侧SOC将接棒GPU

寻找新的智能载体一直是产业链的追求,最大的机会当然在AI终端本身。但是在最大的叙事之外,我们观察到,AI终端的爆发,可能将打开国产芯片一次难得的追赶窗口期,显然也是值得我们重视的“支线任务”。

1. 步入GPU时代霸权的后期

GPU是当下的巅峰。但去年下半年以来,英伟达霸权的两道裂缝越撕越大:一个是博通预计2027年ASIC(Application Specific Integrated Circuit,专用集成电路)将达到600亿―900亿美元,一个是DeepSeek的训练GPU小时数据估算只有同类模型的25%左右。

随着英伟达信仰的松动,美股对芯片的关注点逐渐从GPU转到了新的数字芯片,即ASIC和AI终端芯片,两个方向都孕育着新的产业机会。AI终端芯片,其AI功能将依靠NPU模块实现,相对服务器,还要求成本、能耗、可靠性、安全和个性化,搭载NPU模块的SOC将是最优解。

随着AI带来量价齐升的机遇,Market Reaserch预计,全球SOC市场规模到2032年将超过3200亿美元。

2. 聚焦端侧芯片AI SOC

SOC,即system on chip,直接翻译过来就是把计算和其他电子系统集成在一块硅片上,也被称为系统级芯片。根据市场已有的主流SOC,其硬件功能一般集成了CPU(中央处理器)、GPU(图形处理器)、NPU(神经网络处理器,实现AI功能的关键)、ISP(图像信号处理器,手机摄像头的核心)、多媒体视频编解码器、WiFi、多种接口等。

但是完整的SOC系统,除了硬件设计之外,还要提供系统级的软件参考设计,包括如安卓、鸿蒙的OS,以及配套的驱动软件、算法、中间件。

集成各种软件和硬件功能的SOC,是一个真正的多面手,可以处理数字信号、模拟信号、混合信号,甚至射频信号,常常应用在嵌入式系统中,广泛搭载在手机、可穿戴、智能音箱、智能汽车等各个智能终端上。

也正是由于硬件设计难度高,软件还具有生态壁垒,SOC这个约1600亿美元的大赛道,主要被高通、联发科、苹果、三星等少数企业垄断,比如高通由于垄断SOC变得肆无忌惮,时常挥舞专利的大旗,让下游手机厂苦不堪言。在手机和智能车机时代,国产SOC芯片被压着打毫无还手之力。国内SOC企业,只能在一些边缘市场中苦苦挣扎,比如电视机、白牌机、学习机。国内此前真正完成突破的是华为,其子公司海思设计的SOC芯片,由于硬件设计能力强,又依托华为手机的生态,靠年出货量超1亿部,一度威胁到苹果的生存,只不过后来被美国系统性针对,导致国内的SOC行业又陷入寂静的长夜。

比市场规模快速扩大更激动人心的是,AI推理时代,现有海外垄断的格局将生变,AI终端芯片中的国产企业可能迎来翻身良机。AI在边缘侧的应用越来越广泛,SOC将变成集成人工智能(AI)和边缘计算能力的系统级芯片,成为AI SOC, 算力达到几十甚至数百TOPS。除了硬层面的更新,AI大模型还将导致传统OS生态开始松动,即基座大模型掌握话语权而不一定是传统的OS企业。产业链话事人的变化,随之而来的就是供应链的重新洗牌,对于软硬件并重的SOC更是如此。比如字节AI耳机选的主控芯片是恒玄科技、智能玩具选的主控SOC是乐鑫科技,而不再是高通、联发科一统江湖。

▲黄仁勋发布 NVIDIA Blackwell RTX 50 系列 GPU

03

如何看待国产SOC芯片的前景

以前,国产SOC企业的举步维艰,除了硬件设计的差距之外,更让人难以逾越的是封闭的生态。国产SOC企业始终陷在“先有蛋还是先有鸡”的死循环中。如上所述,AI对智能终端的重塑,将不亚于新能源对汽车行业的改造,除了终端霸主格局可能生变之外,被围困许久的国产SOC企业,也可能迎来换道超车的机会。

国内企业由于制程为代表的硬件性能落后,软件生态又切不进去,一般大家的印象就是国产的技术实力不行。但实际上,在夹缝中求生存的国产SOC企业技术实力并不弱。靠份额说话的有力论据也有几例。除了曾跻身世界第一梯队的华为海思外,未上市的紫光展锐在4G手机SOC中也是主流玩家,晶晨股份在机顶盒、电视机行业中都具有跟海外龙头掰手腕的能力。更能说明问题的是,在最近几年中,我们观察到只要产品生态解耦重构,国产芯片基本上都能抓住机遇。

AI终端,将重构智能产业链分工。以前开发一个SOC芯片,必须打入手机才能在其他市场中生存。但现在面向AI,大家都是在同一起跑线上,甚至在要求的低成本、低功耗的场景中,国产企业还更胜一筹。

不同于手机,AI的下游比较分散,耳机、手表、音箱、玩具、扫地机器人等设备所强调的功能各不相同,过去开发一款手机SOC,然后在其他领域做阉割版的方式不再行得通,国产企业内卷式快速响应的打法,更为下游客户所青睐。正像云计算,带来了白盒化趋势和光模块解耦。

另外脱钩断链的背景下,下游的国内客户更加扶持国产供应,比如说字节选用乐鑫科技、恒玄科技等。

除海思和展锐外,大部分SOC企业都已经完成了上市,这些公司收入和利润体量都不大。但2024年以来,他们的基本面都在发生着积极的变化,未来值得关注。从跟着喝汤,到上桌吃肉,国产SOC芯片的翻身机会,在AI时代被开启。

文/启新

编辑/莘然

本文刊载于《中外企业文化》2025年3期

来源:中外企业文化

相关推荐