谷歌云推出面向毫秒级延迟工作负载的 Rapid Storag

B站影视 电影资讯 2025-05-20 16:31 2

摘要:在近期举行的 Google Cloud Next 2025 大会上,这家云计算提供商宣布了 Rapid Storage。这是一种新的 Cloud Storage 可用区(zonal)存储桶,旨在为频繁访问的数据和延迟敏感的应用提供一致的个位数的毫秒级数据访问。

作者 | Renato Losio

译者 | 平川

策划 | 丁晓昀

在近期举行的 Google Cloud Next 2025 大会上,这家云计算提供商宣布了 Rapid Storage。这是一种新的 Cloud Storage 可用区(zonal)存储桶,旨在为频繁访问的数据和延迟敏感的应用提供一致的个位数的毫秒级数据访问。这种新的存储类型提供了低于 1 毫秒的随机读写延迟,数据访问速度提高了 20 倍,吞吐量达到了 6TB/s。

与传统的跨多个可用区(同一区域中)的云存储桶不同,Rapid Storage 可用区存储桶将数据保存在与 GPU 和 TPU 相同的可用区内,帮助工作负载实现更高的吞吐量和亚毫秒级的读写延迟。谷歌副总裁兼总经理 Sameet Agarwal 和高级产品经理 Asad Khan 解释了他们的目标:

要在峰值效率下训练、生成模型检查点和提供 AI 模型,你需要让 GPU 或 TPU 达到数据饱和,从而最小化计算浪费(...)传统对象存储存在一个很大的缺陷:延迟。借助谷歌的 Colossus 集群级文件系统,我们提供了一种新的方法,将存储和 AI 加速器置于同一个新提供的可用区存储桶中。

借助 Cloud Storage FUSE,Rapid Storage 存储桶可以作为一个文件系统进行挂载,并且支持 TensorFlow 和 PyTorch 等常见的 AI 框架。在“Colossus:Rapid Storage 高性能揭秘”一文中,谷歌杰出软件工程师 Denis Serenyi 和谷歌产品组经理 Vivek Saraswat 解释了他们如何增加了一个基于状态的 gRPC 流式协议以及向对象追加数据的能力,同时还保持了对象存储的高总吞吐量和规模。

在 Reddit 上一个热门的帖子中,社区将谷歌提供的这个新选项与亚马逊 S3 Express 进行了比较。Buf 公司首席技术官 Akshay Shah 评论道:

非常酷!这让谷歌成为唯一一个拥有低延迟单可用区对象存储、标准区域对象存储和透明复制双区域对象存储的主要云服务商,所有这些都使用相同的 API。

在谷歌云宣布新存储类型的同一周,亚马逊云科技宣布,S3 Express One Zone 存储价格降低 31%,PUT 请求价格降低 55%,GET 请求价格降低 85%。Agarwal 和 Khan 声称:

与其他领先的超大规模提供商相比,Rapid Storage 的随机读写延迟降低了 5 倍,而且提供了每存储桶高达 6TB/s 的吞吐量和每秒高达 2000 万次的查询(QPS)。

在 Cloud Next 2025 大会上,Rapid Storage 并不是唯一一份面向 AI 工作负载的存储公告:Anywhere Cache 是一个 SSD 缓存,搭配现有的区域(regional)存储桶,可以在选定的可用区内缓存数据,而 Google Cloud Managed Lustre 是基于 DDN EXAScaler Lustre 文件系统构建的高性能并行文件系统,以低于 1 毫秒的延迟、数百万的 IOPS 和 TB/s 的吞吐量为 AI 工作负载提供 PB 级的规模。

目前,Rapid Storage 尚处于预览阶段。

原文链接:

声明:本文由 InfoQ 翻译,未经许可禁止转载。

今日好文推荐

来源:InfoQ

相关推荐