铠侠(Kioxia)在本周早些时候的企业战略会议上宣布,计划推出一款突破性固态硬盘(SSD),旨在将小数据块工作负载下的每秒输入/输出操作(IOPS)性能提升至1000万次以上——这一速度是当前多数高端SSD峰值性能的三倍。该公司同时透露将与英伟达(Nvidia)展开合作研发。

Cover Image

当前AI服务器的性能瓶颈主要源于存储与GPU之间的数据传输机制,现有方案需通过CPU中转,导致延迟显著增加。为突破这一限制,铠侠正在设计新型控制器,专门优化以实现超过1000万次512字节随机IOPS的性能目标,确保GPU能以持续满载核心算力的速度访问数据。

这款“AI SSD”将采用铠侠独有的单层单元(SLC)XL-Flash存储技术,其3-5微秒的读取延迟远低于传统3D NAND SSD的40-100微秒水平。SLC架构每个存储单元仅存放1比特数据,不仅访问速度更快,耐久性也更优异,这些特性对高强度AI工作负载至关重要。

目前高端数据中心SSD在4K和512字节随机读取场景下通常仅能实现200-300万IOPS。虽然从带宽角度看4K数据块更高效,但大语言模型(LLM)和检索增强生成(RAG)系统往往需要频繁随机访问嵌入向量、参数或知识库条目。在这些应用场景中,512字节的小数据块比4K块更能反映真实需求,通过多盘协同即可满足带宽要求,同时更适配GPU内存子系统的突发访问特性——GPU内部缓存行通常为32/64/128字节,512字节读取能更好匹配其架构设计。

值得注意的是,铠侠尚未公布这款SSD将采用何种主机接口,但从带宽需求判断可能无需PCIe 6.0。该产品还将优化GPU与SSD间的点对点通信,绕过CPU以提升性能并降低延迟。这种设计特别适合需要快速反复访问海量数据集的LLM训练场景,也能增强采用实时数据进行推理的生成式AI系统性能。

铠侠“AI SSD”计划于2026年下半年正式发布,届时将与全球最大GPU制造商(即英伟达)共同完成产品开发。该技术有望为AI计算基础设施带来存储范式的根本性变革


文章标签: #SSD #AI #英伟达 #存储 #性能

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。