随着AI行业拥有了配备高带宽内存(HBM)的超高性能GPU,存储性能正成为AI训练与推理系统面临的主要瓶颈之一。慧荣科技(Silicon Motion)首席执行官苟嘉章(Wallace C. Kuo)在接受Tom's Hardware独家专访时透露,英伟达(Nvidia)正与合作伙伴共同研发能实现1亿次每秒随机读取操作(IOPS)的固态硬盘,以应对小数据块工作负载需求。

Cover Image

“当前目标设定在1亿IOPS——这是个惊人的数字,”苟嘉章表示。以英伟达B200为代表的现代AI加速器搭载的HBM3E内存带宽已达8TB/s,无论在总吞吐量还是延迟表现上都远超现有存储子系统。目前PCIe 5.0 x4接口的顶级SSD顺序读取速度约为14.5GB/s,4K和512B随机读取性能为200-300万IOPS。虽然4K数据块更适合带宽测试,但AI模型通常需要执行大量小型随机读取,这使得512B数据块因其低延迟特性成为更优选择。然而在SSD主控和闪存限制下,要实现33倍的IOPS提升极具挑战。

事实上,铠侠(Kioxia)已基于其XL-Flash存储器开发“AI专用SSD”,目标突破512K随机读取1000万IOPS。该产品计划于明年下半年发布,可能与英伟达Vera Rubin平台同步推出。要实现1亿IOPS目标,可能需要组合多块此类SSD协同工作。

但慧荣科技CEO认为,在单块采用传统NAND且保持合理成本与功耗的硬盘上实现1亿IOPS极其困难,可能需要新型存储器技术。“我认为他们正在寻求介质变革,”苟嘉章分析道,“傲腾(Optane)本应是理想方案但已退场。铠侠试图改进XL-NAND性能,闪迪(SanDisk)则推广高带宽闪存(HBF),但坦白说我对后者持保留态度。当前各厂商都在推进自有技术,但行业真正需要的是根本性创新,否则很难兼顾1亿IOPS与成本效益。”

目前美光(Micron)、闪迪等多家企业正在研发新型非易失性存储器,但这些技术何时能实现商用,即便是存储控制器领域的领军企业也难以预测。


文章标签: #AI存储 #英伟达 #固态硬盘 #IOPS #HBM

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。