摘要:这年头,科技圈的瓜比娱乐圈还离谱。前阵子刚吃完“某大厂自研3nm芯片突破”的瓜,转头就炸出“阿里要采购寒武纪15万片GPU”的猛料——15万片啊朋友们!要知道,整个中国数据中心一年的GPU采购量也就百万级别,寒武纪要是真拿下这单,直接原地封神。结果还没等网友们
这年头,科技圈的瓜比娱乐圈还离谱。前阵子刚吃完“某大厂自研3nm芯片突破”的瓜,转头就炸出“阿里要采购寒武纪15万片GPU”的猛料——15万片啊朋友们!要知道,整个中国数据中心一年的GPU采购量也就百万级别,寒武纪要是真拿下这单,直接原地封神。结果还没等网友们激动完,阿里云反手就是一句“消息不实”,把这盆刚烧开的“国产芯狂欢”冷水,浇了个透心凉。
你以为这只是个简单的辟谣?太天真了。这事儿背后,藏着国产芯片供应链最真实的“遮羞布”——我们天天喊“国产替代”,但到底是“真替代”还是“PPT替代”?云厂商嘴上说“支持国产”,身体却很诚实——到底是“不想买”,还是“买不了”?今天咱就扒开这层“15万片GPU”的画皮,看看国产芯片的“虚火”和“实干”,到底差在哪儿。
一、从“15万片”到“不实”:传言是怎么“炼”成的?
先说说这“15万片GPU”的传言有多离谱。15万片是什么概念?寒武纪2023年全年营收才11.2亿元,净利润亏了10.79亿元——要是真卖15万片GPU,就算每片只卖1000块,也得15亿,直接覆盖全年营收还绰绰有余。可问题是,寒武纪有这产能吗?
懂行的都知道,GPU这东西不是拧螺丝,想造多少造多少。它得靠台积电、中芯国际这些晶圆厂代工,而顶级GPU(比如英伟达H100)的代工优先给大客户,寒武纪这种“小玩家”能拿到多少产能?更何况,造一片GPU的成本可不低。台积电7nm工艺代工一片GPU,光晶圆成本就得几千块,加上封装、测试,寒武纪卖一片思元GPU,定价怎么也得万把块。15万片就是15亿,阿里云是开银行的?
那为啥这种一听就扯的传言,能在科技圈疯传三天三夜?说白了,还是“国产芯焦虑”闹的。自从美国卡脖子,英伟达A100/H100断供,大家就像盼星星盼月亮一样盼着“国产GPU站起来”。市场上但凡有点风吹草动,比如“某国产芯片性能追平英伟达”“某大厂采购国产芯片”,立刻就能点燃情绪——哪怕这消息漏洞百出,也有人愿意信:“万一是真的呢?国产芯终于要崛起了!”
更有意思的是传言的“传播路径”。这种消息往往先从“匿名知情人士”嘴里冒出来,接着被某些“科技自媒体”添油加醋(标题必须带“重磅”“突发”“独家”),然后资本闻风而动(寒武纪股价趁机拉一波),最后官方出来辟谣——完美闭环。说白了,就是有人故意放风,利用市场焦虑割韭菜。就像当年“水氢车”一样,只要喊“国产突破”,就有人愿意买单。
二、寒武纪:“AI第一股”的GPU梦,碎了吗?
要聊这事儿,绕不开寒武纪。作为“AI芯片第一股”,它当年上市时可是风光无限——2020年登陆科创板,募资25.8亿元,市值一度冲上千亿。结果呢?上市四年,年年亏损,2023年营收11亿,亏了10亿,市值从千亿跌到现在的百亿出头。说好的“AI芯片龙头”,怎么混成这样?
问题就出在它的GPU产品上。寒武纪这些年推了不少“思元”系列GPU,比如思元270、思元370、思元470,口号喊得震天响:“对标英伟达A100”“算力突破XX PFLOPS”。但真拉出来遛遛,就露馅了——
性能差太远。拿它最拿得出手的思元370来说,官方宣传“INT8算力256 TOPS”,看着和A100的200 TOPS差不多。但懂行的都知道,算力≠实际性能。跑AI模型时,A100的能效比(每瓦算力)是思元370的2倍以上;跑复杂模型(比如GPT-3),思元370得堆3片才能顶A100 1片。云厂商用它,服务器数量得翻倍,机房电费得暴涨——这成本谁扛得住?
产能跟不上。寒武纪自己不造芯片,得找台积电代工。但台积电的产能是有限的,优先给苹果、英伟达、高通这些大客户。寒武纪这种小客户,只能捡别人剩下的产能,而且还得排队。2023年,寒武纪全年芯片出货量也就几万片,想一下子拿出15万片?除非台积电为它单独开一条产线——可能吗?
成本下不来。代工成本高不说,寒武纪的芯片良率也不行。有业内人士透露,思元370的良率只有50%左右(英伟达A100良率80%以上),相当于造2片坏1片,成本直接翻倍。结果就是:买一片思元370,比买一片A100还贵,性能却差一大截。云厂商又不是慈善家,放着好用又便宜的英伟达不买,买你的“高价低能”产品?
所以寒武纪的困境,不是“缺订单”,是“产品不行”。不是阿里云不想买,是真用不了——用它跑云服务,客户体验下降(卡、慢),成本上升(服务器、电费、运维),最后客户跑了,阿里云喝西北风?
三、阿里云:“一云多芯”是口号,还是真干?
阿里云说“一云多芯支持国产供应链”,这话听着挺提气。但“支持”和“采购15万片”是两码事。要搞懂这事儿,得先明白“一云多芯”到底是啥。
简单说,“一云多芯”是云厂商的“技术保险”。以前云服务器基本只认x86芯片(英特尔、AMD)和英伟达GPU,现在怕被卡脖子,就搞“硬件抽象层”——通过软件适配,让云平台能兼容不同架构的芯片,比如ARM、RISC-V,还有国产的海光、鲲鹏、寒武纪GPU。这样一来,就算某款芯片断供,云平台能快速切换到其他芯片上,不至于瘫痪。
但技术兼容≠实际采购。阿里云的服务器里,国产芯片占比有多少?业内人士估计,不到5%——而且大多是用于测试、边缘计算这些非核心场景。为啥?因为云厂商的命根子是“降本增效”,服务器成本占总运营成本的40%以上,GPU更是核心部件,一分钱都不能瞎花。
用国产GPU,短期就是“花钱买罪受”。比如用思元370替代A100,性能不够就得买更多片,服务器数量增加30%;功耗高一倍,机房电费涨50%;软件适配麻烦,运维团队得重新培训,人力成本上升。算下来,用国产GPU的服务器成本,比用英伟达的高40%以上。阿里云一年服务器采购量几百万台,要是核心业务全换国产GPU,成本得涨几百亿——这钱谁出?用户吗?用户凭啥为你的“国产情怀”买单?
所以阿里云的“支持”,本质是“战略布局”:我可以少量采购,测试兼容性,万一以后英伟达断供,我有备胎。但要说大规模采购(比如15万片),除非国产GPU性能追上英伟达,成本降到同水平——否则免谈。
这次阿里云急着否认“15万片”,说白了就是怕被“道德绑架”。你想啊,要是默认了,下次开会,领导可能就问:“既然能买15万片,为啥不多买点支持国产?”投资人可能问:“买这么多低效芯片,利润还要不要了?”用户可能问:“用国产GPU,我的服务会不会变慢?”——索性直接否认:“没这事儿,别瞎传!”
四、国产芯片突围:别再“PPT狂欢”,该“实干兴芯”了
扒了这么多,其实想说明一个道理:国产芯片现在最缺的不是“订单”,是“实力”。天天喊“国产替代”,但替代的前提是“能用、好用、便宜用”——这三点,目前国产GPU一个都没做到。
先别吹“算力”,先练“内功”。国产芯片厂商总喜欢吹“算力突破XX”,但客户要的是“跑模型快、耗电少、稳定不崩”。比如跑GPT-4,A100跑一轮要1小时,国产GPU跑3小时,还时不时死机——这种“高算力”有啥用?不如沉下心优化架构,提升能效比,把软件栈(编译器、驱动、框架适配)做好。英伟达厉害的不是硬件,是CUDA生态,国产芯片得把生态建起来,不然硬件再好,开发者不用,也是白搭。
别靠“订单续命”,得靠“市场赚钱”。总想着“等大厂订单”“等政府补贴”,是走不远的。芯片是商业产品,得靠市场赚钱活下去。寒武纪2023年政府补贴3.5亿,占营收的31%——这种“补贴依赖症”,能撑多久?不如去抢边缘计算、安防监控这些“非高端”市场,先把量做起来,积累经验,再慢慢往高端走。
市场和资本,给点“耐心”。造芯片不是搞互联网,三个月出个APP就能赚钱。它得十年磨一剑,台积电、英伟达都是几十年才熬出来的。现在资本市场太浮躁,寒武纪一亏损,股价就暴跌;某芯片公司说“三年盈利”,就有人追着买。这种心态要不得——芯片研发就是“烧钱”,得允许企业亏损,给时间让技术迭代。
政策扶持,别搞“指标摊派”。有些地方为了“国产替代”,给云厂商下指标:“今年国产芯片采购量必须占30%”。结果呢?厂商表面应付,买了堆芯片放仓库,实际还用英伟达。这种“拔苗助长”的政策,除了浪费钱,一点用没有。不如把补贴给研发:企业每投1块钱研发,政府补5毛;把钱给人才:芯片工程师年薪百万,政府给安家费——这才是真支持。
结尾
说到底,“15万片GPU”的传言,就像一面镜子,照出了国产芯片的“虚火”和“焦虑”。我们太渴望国产芯片站起来了,以至于愿意相信离谱的传言,容忍厂商的“PPT芯片”。但芯片行业的规律是“实干兴芯”,不是“口号兴芯”。
下次再有“某大厂采购XX万片国产芯片”的消息,咱先问三个问题:它有这产能吗?性能够用吗?买回去能赚钱吗?想明白了,就不会被割韭菜了。
国产芯崛起,靠的不是键盘侠的热血,是工程师的熬夜改代码,是企业家的十年磨一剑,是全行业的冷静和耐心。瓜吃完了,该干活了——毕竟,芯片是造出来的,不是吹出来的。
来源:倪卫涛