摘要:初创期(1993-1999)。1993年由黄仁勋、Chris Malachowsky和Curtis Priem创立,目标是开发高性能图形芯片。1999年推出GeForce 256,首次定义“GPU”(图形处理器),奠定游戏显卡市场基础。
1. 初创期(1993-1999)。1993年由黄仁勋、Chris Malachowsky和Curtis Priem创立,目标是开发高性能图形芯片。1999年推出GeForce 256,首次定义“GPU”(图形处理器),奠定游戏显卡市场基础。
2. 技术突破期(2000-2006)。通过DirectX和OpenGL兼容性击败3dfx等对手,成为PC游戏显卡霸主。2006年发布**CUDA架构**,尝试将GPU用于通用计算(GPGPU),但初期市场反应冷淡。
3. 转型期(2007-2016)。从游戏到计算,CUDA生态逐渐成熟,吸引科学计算和AI研究者使用GPU加速。2012年AlexNet在ImageNet竞赛中依赖GPU训练,标志AI时代开启,英伟达开始向数据中心倾斜资源。
4. AI迅猛爆发期(2017-2023)。Volta(2017)、Ampere(2020)、Hopper(2022)架构连续升级,专为AI优化。CUDA开发者超400万,形成生态体系,兼容TensorFlow/PyTorch等框架,形成软硬件闭环。英伟达市值开始飞跃,2023年市值突破万亿美元,成为全球半导体龙头。
1. 技术瓶颈。台积电3nm以下工艺逼近量子隧穿效应,晶体管密度提升趋缓。AMD采用Chiplet设计(如MI300X)可以更低成本挑战H100的算力霸权。
2. 市场风险。客户集中,Meta、微软等云巨头贡献超50%数据中心收入,若自研芯片(如TPU v5、Azure Maia)成熟,可能削弱订单。美国对华高端GPU禁令迫使中国发展替代方案(如华为昇腾910B),长期或丢失部分市场。
3. 生态护城河的潜在裂痕。AMD ROCm、Intel oneAPI、开源框架(如OpenCL)加速追赶,但生态迁移成本仍是关键障碍。PyTorch 2.0开始支持非CUDA后端,可能降低开发者绑定。
短期(5年内)崩溃概率极低。AMD在AI芯片领域落后1-2年,中国厂商受制于先进制程(如中芯国际7nm良率)。CUDA代码库积累超20年,重写成本高昂(据估计迁移到ROCm需增加30%开发成本)。
长期(10年+)来看,风险亦不高,若量子计算或光子芯片实用化,可能绕过传统GPU优势,但短期内难以商业化。反垄断调查或强制开源CUDA可能削弱控制力,但需全球监管协同,当前国际局势基本没有可能。
1. 美国竞争对手:AMD与英特尔。
AMD方面。CDNA架构(MI300X)在显存带宽(5.3TB/s vs H100 3.35TB/s)占优,但软件生态差距显著。
英特尔方面。Ponte Vecchio GPU采用Foveros 3D封装,但Gaudi加速器市占率不足5%。
2. 中国厂商:政策驱动下的追赶。
华为昇腾。910B性能达H20级别,但受制于7nm工艺(台积电代工受限后转中芯国际N+2)。
壁仞科技BR100。算力峰值1PFLOPS(FP16),但软件栈成熟度不足,需适配国产AI框架(如百度PaddlePaddle)。
3. 其他地区:买买彩票拉倒。
欧洲:RISC-V架构GPU(如Imagination Technologies)可能从边缘端切入,但难以撼动数据中心。
日本:Preferred Networks自研MN-Core芯片,但局限于本土超算项目。
5年内仍旧看强。英伟达仍将保持60%以上AI芯片份额,依靠Blackwell架构和NVLink 5.0维持技术领先。
10年窗口看变量。关键变量是量子计算突破或中国实现28nm以下自主制造,若未发生,CUDA生态可能延续统治。
也可以期待一下云厂商自研芯片+开源生态联盟,例如AWS Trainium+PyTorch的深度整合,可能从需求端瓦解垄断,若英伟达触犯众怒,也不是不可能,聊胜于无。
来源:时光笔记2101