AMD-OpenAI 建立AI芯片联盟:Instinct MI450将被部署成6GW AI算力

B站影视 电影资讯 2025-10-07 09:38 1

摘要:AMD与OpenAI于10月6日宣布一项多年度、多代战略联盟,公司将为OpenAI提供总计6吉瓦的Instinct系列GPU计算资源,这一规模相当于为450万户家庭供电。该协议以OpenAI作为核心战略计算伙伴,从AMD Instinct MI450系列起步,

AMD与OpenAI于10月6日宣布一项多年度、多代战略联盟,公司将为OpenAI提供总计6吉瓦的Instinct系列GPU计算资源,这一规模相当于为450万户家庭供电。该协议以OpenAI作为核心战略计算伙伴,从AMD Instinct MI450系列起步,扩展至机架级AI解决方案及后续世代。首阶段1吉瓦MI450 GPU部署定于2026年下半年启动,这一里程碑不仅标志着OpenAI对AMD技术的早期采用,还通过股权激励机制绑定长期协作,凸显AMD在AI硬件领域的加速布局。

协议细节显示,AMD向OpenAI发行至多1.6亿股普通股认股权证,行使价0.01美元,分阶段归属:首笔随1吉瓦部署解锁,其余依总规模和技术里程碑释放。这相当于潜在9.9%股权激励,预计为AMD带来数百亿美元营收。AMD首席执行官丽莎·苏表示,这一伙伴关系“将AMD与OpenAI的最佳实践结合,创造双赢局面,推动全球最雄心勃勃的AI建设并推进整个AI生态”。OpenAI首席执行官萨姆·奥特曼则称:“AMD在高性能芯片上的领导力将加速我们的进展,让先进AI的益处更快惠及每个人。”

AMD的Instinct MI450 AI芯片

Instinct MI450作为首发主力,基于CDNA 4架构和台积电3nm工艺,针对AI训练与推理优化,提供比MI300X更高的浮点运算密度和内存带宽。工程设计强调机架级集成,支持HBM3E内存堆叠和NVLink互联,单GPU功率预计达750W以上,以实现每吉瓦集群的万亿级参数模型处理。尽管具体核心数和TOPS指标尚未公布,但测试显示,其在低精度格式如FP8下的效率可达NVIDIA H200的90%以上,避免了传统GPU在多节点扩展时的瓶颈。

AMD的软件栈ROCm将与OpenAI的模型优化工具深度融合,确保从MI300X的现有集成平滑过渡。相比NVIDIA的CUDA生态,ROCm的开源特性虽更灵活,却需持续迭代以匹配企业级稳定性。这一合作或加速其成熟,MI450的Helios机架将整合MI400 AI芯片和下一代EPYC Venice CPU,提供432GB HBM4内存,内存容量和带宽较NVIDIA Vera Rubin平台高50%,计算性能大致相当。工程上,这种融合需精密的电源管理和液冷系统支撑,预计将吸引云巨头如微软和谷歌的跟进。

消息公布后,AMD股价在周一飙升近24%,创S&P 500和纳斯达克当日最佳表现,今年累计涨幅接近70%,市值增加约600亿美元。NVIDIA股价同期微跌1%,反映投资者对AMD蚕食份额的预期。AMD预计该协议将贡献“数十亿美元营收”,对非GAAP每股收益高度增益。OpenAI上半年营收43亿美元,但现金消耗25亿美元,这一联盟有助于其控制成本,同时多元化供应商,避免对NVIDIA的过度依赖。

这一反应源于AI基础设施需求的爆炸式增长,OpenAI的Stargate项目已承诺超1万亿美元投资,包括与Oracle和软银的5个7吉瓦数据中心。AMD的协议不仅验证了MI450的市场潜力,还标志其从NVIDIA的追随者向竞争者转型。分析师Wedbush指出:“AMD的任何残余担忧现在应被抛诸脑后,这为其货币化AI革命提供了主要平台。”

AI芯片市场在2025年正从单一供应商主导向多元化倾斜,这一协议凸显AMD在数据中心领域的突破。市场数据显示,全球AI基础设施支出预计超1万亿美元,OpenAI的6吉瓦部署占其中显著份额,推动AMD Instinct系列出货量年增长超50%。相比NVIDIA的Hopper和Blackwell架构,AMD的MI450在性价比上更具吸引力,每瓦算力提升15%,尤其适合OpenAI的混合工作负载。但NVIDIA股价在消息公布后微跌1%,反映投资者对AMD蚕食份额的担忧,后者当前AI GPU市场占比约15%,预计2026年升至25%。

这一趋势源于计算需求的指数爆炸:生成式AI模型参数从万亿级跃升至百亿级,传统数据中心功率已达极限。AMD的协议不仅缓解OpenAI对NVIDIA的依赖,还刺激供应链调整,如SK海力士增加HBM产能以匹配MI450需求。工程观察显示,吉瓦级部署推动液冷普及,预计2026年相关市场规模翻番,但也暴露能源挑战:6吉瓦相当于中型核电站负载,需绿色电力支持以符合碳中和目标。

竞争中,AMD的股权机制创新性强,类似于微软对OpenAI的投资,却更注重技术里程碑。这或吸引谷歌和亚马逊等云巨头跟进,加速从GPU垄断向多架构生态转型。但风险在于执行:MI450的良率需达95%以上,方能按期交付。

实现吉瓦级GPU集群的工程难点在于互联与热控:MI450的NVLink 5.0虽提供3TB/s带宽,但多节点下延迟易放大10%,需AMD的Infinity Fabric优化缓解。同时,OpenAI的软件栈需适配ROCm,避免CUDA迁移成本过高。股权解锁的里程碑设计虽激励创新,却增加监管审查,如美国外国投资委员会的潜在介入。

展望2027年,这一合作或扩展至量子-AI混合系统,支持OpenAI的超级代理开发。市场预计,AMD营收中AI贡献将超40%,但需监控地缘因素对台积电供应的影响。

尽管合作框架宏大,这个协议能否真正落地并释放价值,还有不少关键瓶颈需要警惕:

风险 /挑战说明良率与量产能力要大规模出货,AMD 必须在 MI450 或后续系列芯片上取得高良率、稳定产能。如果初期良率低或出货延误,可能无法满足 OpenAI 的部署节奏。互连 /带宽 /延迟瓶颈在大规模 AI 加速器布置中,CPU 与 GPU 之间、GPU 与 GPU 之间的互连延迟与带宽是性能瓶颈之一。AMD/ OpenAI 需要设计出高效的互连机制(例如高带宽总线 /互联 /缓存共享设计)以避免性能折损。软件 /驱动 /生态兼容硬件优势若无法被软件层面充分驱动(驱动稳定性、库 /框架兼容、调优工具、内存 /缓存管理等),最终性能可能受限。OpenAI 与 AMD 在软件体系、模型适配优化方面必须同步强劲。资本 /现金流风险虽然协议潜在回报巨大,但在早期各阶段的投入巨大且风险高。OpenAI 是否有充足资本支持其承诺的采购规模及部署能力,是其必须考量的因素。竞争对手反应 &生态封锁NVIDIA、Intel、其他 AI 芯片厂商不会被动接受。它们可能加速自研、调整定价 /补贴 /合作策略来挤压 AMD 的市场空间。

总体而言,这一联盟揭示AMD在AI硬件领域的关键一跃,但其成效取决于协作深度。总而言之,这一合作是 AMD 与 OpenAI 在 AI 基础设施领域的重磅押注,也是 AI 硬件赛道迈向多极竞争的重要信号。未来 1–2 年的进展,将决定它是否真能成为产业变革中的关键节点。

来源:万物云联网

相关推荐