摘要:Sandisk UltraQLC SN670 固态硬盘提供 256 TB 和 128 TB 两种容量选择,采用 BiCS 218 层 3D NAND 技术,搭配 CBA(CMOS 直接键合阵列)2 TB 裸片设计以及 PCIe gen5 NVMe 接口。该固态
闪存正在成为智能、高性能工作负载的关键推动因素。
Sandisk 在 FMS 2025 上宣布推出 256 TB SSD,将于 2026 年上半年发货。
Sandisk UltraQLC SN670 固态硬盘提供 256 TB 和 128 TB 两种容量选择,采用 BiCS 218 层 3D NAND 技术,搭配 CBA(CMOS 直接键合阵列)2 TB 裸片设计以及 PCIe gen5 NVMe 接口。该固态硬盘旨在用于 AI 驱动的数据密集型工作负载,例如数据提取、数据准备和 AI 数据湖。它使用与晶圆厂合作伙伴 Kioxia 相同的 NAND,据悉,其容量比245.76 TB 的 LC9 产品高出10 TB 以上。
Sandisk 首席产品官 Khurram Ismail 表示:“随着我们进入人工智能时代的下一阶段,闪存正在成为智能、高性能工作负载的关键推动因素。”
Sandisk 表示,UltraQLC 硬盘拥有定制的控制器和高级优化功能,但没有快速的单级单元 (SLC) 缓存。它具有直接写入 QLC 功能,可在首次写入时进行断电安全写入。这通常意味着其性能会比使用 SLC 缓存的同等硬盘慢,除非控制器采取一些巧妙的措施来提高速度。
它具有动态频率调节功能,在给定功率水平下,预计性能可提高高达 10%。数据保留 (DR) 配置文件预测可将 DR 循环次数减少高达 33%,从而“提高驱动器的可靠性、弹性和持续数据访问能力,同时降低功耗”。
Sandisk 企业级 SSD 系统架构高级总监 Mike James 在一篇博文中表示:“随着 SSD 容量的不断提升,一些有趣的挑战也随之而来。其中一个例子就是 NAND 上如此大规模的数据回收挑战。你不可能每隔几天就覆盖 128TB 的数据——这既不高效也不有效。因此,我们不断探索新的方法来减少需要回收的数据量,并发明新的方法来减少后台回收的影响。”
Sandisk 表示,SN670 具有“更低的延迟、更高的带宽和更高的可靠性,并可提供当今最苛刻的 AI 工作负载所需的性能”。但是,没有性能数据,例如随机读/写 IOPS 和可用的顺序读/写带宽,也没有耐久性统计数据来支持这一点。
SN670 将于 2026 年上半年推出 U.2(2.5 英寸)规格,其他规格将于今年晚些时候上市。Sandisk 准备在几周内将首批 128TB 固态硬盘交付客户测试。上述博客称,UltraQLC 路线图已扩展到 1PB SSD。
如果 SN670 能够在 2026 年 4 月之前交付,这意味着它还有八个月的开发时间,这可能是没有性能和耐久性数据的原因——驱动器及其控制器尚未准备好进行最终测试。
想要了解性能方面的线索,我们可以参考 Sandisk 的早期信息。在 Sandisk 分拆之前,西部数据曾提到在 2024 年 FMS 上可能会推出128 TB版本的 Ultrastar DC SN655 SSD。这将是一个 PCIe Gen 4 QLC 218 层驱动器,不同于 3.84 TB 到 61.44 TB 的SN655s,后者使用了 TLC 112 层闪存和 PCIe Gen 4 接口。
几个月后,Sandisk 在2 月份的投资者日上展示了 UltraQLC SN670 ,并称其为 PCIe Gen 5 固态硬盘。SN670 与“领先的 Gen 5 128 TB QLC SSD”进行了比较,其随机读取速度提高了 68% 以上,随机写入速度提高了 55% 以上,顺序读取速度提高了 7% 以上,顺序写入速度提高了 27% 以上。当时,它计划于 2025 年第三季度上市,容量分别为 128 TB 和 64 TB,可用容量分别为 122.88 TB 和 61.44 TB。该日期已推迟了两个或更多季度,其最大容量也翻了一番,这意味着需要进行更多测试。(尽管我们曾要求提供详细的性能数据,但 Sandisk 的 SN670 公告中并未提供。)
三个月后,即 5 月,Sandisk 首席执行官 David Goeckeler 谈到了新的2 Tb QLC NAND 芯片,该芯片将用于即将推出的 128 TB 和 256 TB 驱动器,具有 PCIe Gen 5 和 6 互连以及新的 Stargate SSD 控制器。
在此基础上,PCIe Gen5 SN670 的性能将远高于使用 PCIe Gen 4 的 SN655,以及Solidigm 和 Phison大容量 PCIe Gen 5 SSD。
铠侠的AI SSD也预计在2026年推出。
据报道,铠侠(Kioxia) 准备推出突破性AI SSD(AI 固态硬盘),目的彻底改变AI 服务器的储存生态,并显著提升效能,将成为AI 关键推动者,特别是大型语言模型(LLM) 和检索增强生成(RAG) 系统。
目前现代AI 服务器主要效能瓶颈是储存与图形处理单元(GPU) 间的数据传输效率。数据通常需要通过中央处理器(CPU) 传输,大幅增加延迟并延长存取时间,阻碍GPU 核心满载。
铠侠AI SSD正是为了解决这个核心问题而设计,专门针对最大化输入输出操作每秒(IOPS) 最佳化的新型控制器,目标是小区块工作执行下达到1,000 万IOPS 以上。这项效能指标是当前许多高端数据中心SSD 三倍以上,这些SSD 通常在4K 和512 位元组随机读取操作中达到200 万到300 万IOPS。
AI SSD 采单层储存(SLC) XL-Flash 存储器,读取延迟仅3~5 微秒,与传统3D NAND 的SSD 延迟40~100 微秒明显提升。每单元储存一位元,SLC 不仅存取时间更快,耐用度也更高,都是要求严苛的AI 工作负载不可或缺的属性。
AI SSD 另一项关键创新是其对GPU 与SSD 之间点对点通讯的优化。这将允许数据直接在GPU 和SSD 之间传输,完全绕过CPU,从而进一步降低延迟并提升整体效能。这种设计理念对于保持GPU 核心始终处于100% 利用率至关重要。
数据区块大小方面,最佳化512 位元组区块存取。虽然从频宽角度来看,使用4K 或更大区块通常更具意义,但大型语言模型(LLM) 和检索增强生成(RAG) 系统通常需要对嵌入、参数或知识库条目进行小而随机的存取。在这些情境下,512 位元组等小型区块更能代表实际应用程式的行为,并且能更好地满足LLM 和RAG 在延迟方面的需求。
此外,GPU 通常在32、64 或128 位元组的快取行上操作,存储器子系统也最佳化许多小独立存储器位置突发存取,以确保所有串流处理器持续运作。 512 位元组读取与GPU 设计更契合,也是铠侠(与Nvidia)采512 位元组区块的另一个原因。
铠侠虽未揭露AI SSD 主机界面为何,但从频宽角度看,似乎不需要PCIe 6.0 界面。新产品预定2026 下半年发表,有望为AI 服务器带来显著的效能飞跃,推动人工智能发展。
*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。
想要获取半导体产业的前沿洞见、技术速递、趋势解析,关注我们!
来源:半导体产业纵横