英伟达不再独霸?谷歌AI芯片算力追平B200

B站影视 电影资讯 2025-04-10 13:30 1

摘要:4月9日,在拉斯维加斯举办的 Google Cloud Next 25 大会上,谷歌推出了第七代TPU---Ironwood。该芯片专为支持大规模思考和 AI 推理模型设计,是谷歌迄今为止性能最强的TPU。

4月9日,在拉斯维加斯举办的 Google Cloud Next 25 大会上,谷歌推出了第七代TPU---Ironwood。该芯片专为支持大规模思考和 AI 推理模型设计,是谷歌迄今为止性能最强的TPU。

TPU (Tensor Processing Unit)即张量处理单元,是一种专门为加速深度学习任务而设计的人工智能芯片,由谷歌公司在2015 年首次提出,第一代TPU于2016 年正式发布。

官方表示,Ironwood 的推出标志着人工智能及其发展基础设施,从提供实时信息供人类解读的响应式人工智能模型,到能够主动生成洞察和解读的模型的转变。

在推理时代,Agent将主动检索和生成数据,以协作的方式提供洞察和答案,而不仅仅是数据。而实现这一点,需要同时满足巨大的计算和通信需求的芯片,以及软硬协同的设计。

Ironwood 最高配集群可拥有9216个液冷芯片,峰值算力42.5 ExaFlops,也就是每秒运算42500000000000000000次。

据nextplatform介绍,该芯片是谷歌首款在其张量核心和矩阵数学单元中支持 FP8 计算的 TPU。

Ironwood的FP8算力为4614 TFlops,略高于英伟达B200标称的4500 TFlops。内存带宽7.2TBps,略低于B200的8TBps。

此外,Ironwood 芯片中使用到的第三代 SparseCore 加速器编码了各种算法,可以实现加速金融和科学计算的目的。

SparseCore 加速器首次亮相于 TPU v5p,并在去年的 Trillium 芯片中得到了增强。它的最初设计目的是加速推荐模型,而这些模型利用嵌入来跨用户类别进行推荐。

官方数据显示,Ironwood的每瓦性能是去年发布的第六代 TPU Trillium 的两倍。每芯片容量达到192 GB,是 Trillium 的 6 倍,能够处理更大的模型和数据集,减少频繁数据传输的需求,并提升性能。

谷歌计划在不久的将来把TPU v7整合到谷歌云AI超算,持包括推荐算法、Gemini模型以及AlphaFold在内的业务。

据悉,OpenAI联合创始人兼首席科学家Ilya Stutskever的AI初创公司Safe Superintelligence 正在利用Google Cloud的TPU芯片来支持其AI研究。

来源:观察者网

相关推荐