摘要:英伟达的高利润可能要被自家客户一点点蚕食了。大公司的自研AI芯片正在迅速铺开,最后会把英伟达能拿到的利润切走一部分,别看现在英伟达占得多,但趋势已经明摆着了。
英伟达的高利润可能要被自家客户一点点蚕食了。大公司的自研AI芯片正在迅速铺开,最后会把英伟达能拿到的利润切走一部分,别看现在英伟达占得多,但趋势已经明摆着了。
这几个月发生的事挺好看,动作都很直接。OpenAI宣布和博通合作,开始做定制芯片设计;Meta在九月底把芯片初创公司Rivos收进怀里,想把关键技术攥在手里;亚马逊的“雷尼尔计划”也在推进,准备在自家数据中心部署成千上万颗Trainium2,给Anthropic用——外面已经能看到Anthropic对这些芯片的需求在变热。还有消息说,谷歌从九月开始把自家TPU卖给外部云客户——如果真放开卖,和英伟达在市场上正面交锋就不再只是猜测。总的感觉是,大家都把算力这口饭从外头往自家屋檐下面搬。
这不是一夜之间的事。谷歌做TPU十多年了,算是跑在前头;亚马逊2015年收购Anapurna Labs打基础,2020年推出第一代Trainium;微软直到2023年才把Maia芯片端出来,起步比别人晚一点。步子不同但方向一致:用更贴自家软件堆栈的芯片,以更低的成本,跑出更高的效率。说白了,就是想不再被外面一家一家租算力绑着走。
原因很现实:成本和话语权。定制芯片通常在单位成本上更划算,对自家模型的适配也更好。Seaport的分析师杰伊·戈德堡直白地说,云厂商不想被英伟达绑住。把算力来源掌握在自己手里,定价、调度、优化都有主动权,省下的钱和提升的效率,久了就是竞争力。换个角度看,原来是客户的公司,慢慢变成了潜在的竞争对手,这对英伟达来说,确实是个复杂局面。
市场规模给出了一些数字感。摩根大通年中的一份报告估算,到2028年,像谷歌、亚马逊、Meta、OpenAI这些公司自研的定制芯片,可能占AI芯片市场大约45%的份额。现在2024年大约是37%,预计到2025年能到40%。剩下的主要还是GPU阵营,包括英伟达和AMD。这个预测说明未来几年不会冷,市场会更分散,也更热闹。
要说英伟达目前为什么还能拿高溢价,不只是因为单颗GPU算力强,更因为生态和整套方案。黄仁勋在一次播客里强调,英伟达卖的并不只是芯片,而是一整套AI基础设施——Blackwell GPU、基于Arm的CPU、网络产品和成套的软件工具链。把硬件、软件、服务和整箱解决方案一块儿捆起来,这种整合能力不是谁都能马上复制。要跟英伟达正面干,不光是做出一块芯片那么简单。
市场上也有人觉得,大家都有着落的空间。美银的维韦克·阿里亚认为,英伟达能把蛋糕做大,不会被完全挤掉。DA Davidson的吉尔·卢里亚也说,整体算力需求会持续攀升,市场会扩张,英伟达还能继续成长,只是增速可能放缓一点。卢里亚还估计,谷歌的TPU加上DeepMind的业务,估值可能高达9000亿美元,这说明云厂商手里的自研牌很值钱,能带来实打实的商业价值。
再看技术和开发者习惯的那一面。很多AI工程师偏爱英伟达,原因很现实:软件工具、库和成熟生态。自研芯片如果要被开发者接纳,不只是把硬件做好,得把软件链、开发工具、调优经验和社区都铺起来。这事门槛高,投入时间和人力都不少。戈德堡提醒,做自研芯片不是每家公司都能把技术和生态两头抓住,真正能威胁到英伟达的大玩家,可能不会太多。
拿几个具体案例细说会更清楚。OpenAI现在还是很依赖英伟达,主要通过租用微软或CoreWeave的数据中心来得到GPU,但它同时和博通拉近了合作,想把芯片设计能力拿回来;Meta收购Rivos,显然是想把更多底层把控权攥在手里;亚马逊的雷尼尔计划目标很大,宣称要部署数十万颗Trainium2,让Anthropic之类的客户能在亚马逊数据中心跑大模型;市场观察者发现,这类大规模部署确实推动了亚马逊自研芯片的需求。每一步都不是小动作,既是技术博弈,也是商业战略。
时间表上也有盯点。戈德堡和供应链里的人聊过,觉得2026年前后会是一个动作频繁的阶段。那时候不仅仅是各厂内部的自研试验成熟,可能会出现更多把自研芯片拿去对外卖、更多厂商寻求合作,甚至并购事件也可能增加。可以想象,行业会像电视剧里一样,既有技术比拼,也有商业棋子移动。
说清利弊很重要。定制芯片的好处显而易见:单次运算成本更低,针对特定模型可以做深度优化,能省钱还能提速。短板也明显:开发难,生态不成熟,外部扩展受限。结果会是分化的局面——有的公司能把自研做到位,成为英伟达的替代者;有的可能中途放弃,回过头继续买英伟达的现成方案。就像戈德堡最后说的,做这件事不容易,最后并非每个人都能成功。
来源:聪明的孔雀yleNTi
