英伟达(NVIDIA)的下一代维拉·鲁宾(Vera Rubin)人工智能系统预计在未来几年将消耗数百万太字节的固态硬盘容量,这有可能引发NAND闪存供应冲击。

在智能体人工智能环境中,最大的瓶颈之一是查询处理会生成一个用于构建上下文的巨大临时内存日志,即KV缓存。目前,这些数据存储在HBM模块中。然而,考虑到人工智能集群内部的数据需求正以多快的速度增长,HBM已无法在板载容量上满足需求。正因如此,在2026年国际消费电子展(CES 2026)上,英伟达宣布其Bluefield-4 DPU将连接到一个名为推理内存上下文存储(ICMS)的新存储解决方案。虽然这将显著提升数据处理能力,但也可能引发类似于DRAM短缺的情况。
根据花旗集团(Citi)的分析,据称一套维拉·鲁宾系统可为机架内的每个GPU配备大约16 TB的NAND闪存,在单个NVL72配置中总计达1,152 TB。并且,根据花旗集团的估计,维拉·鲁宾系统的出货量在2027年可能增长至10万套。这意味着,仅英伟达一家公司,对NAND存储的需求就可能增加至1.152亿TB,占未来几年全球NAND总需求预测值的9.3%。配备ICMS的维拉·鲁宾系统单凭一己之力就可能造成NAND行业尚未纳入考量的供应冲击。
鉴于英伟达已预测智能体人工智能将成为应用层的下一个主要焦点,对于未来的服务器机架而言,拥有充足的KV缓存池至关重要,这也是为什么对ICMS的需求预计将会增长。同样重要的是要考虑到,由于持续的数据中心建设、推理热潮以及英伟达目前旨在获取全球NAND总产量中相当大一部分的事实,NAND行业已经面临短缺。
可以说,NAND行业可能会面临与我们目前在DRAM领域所见证的类似情况,这并非言过其实,因为人工智能制造商们并不打算停止对更强大计算能力的追求。而对于普通消费者而言,获取通用SSD和存储设备可能将成为另一场噩梦。



