谷歌TurboQuant曾被视为解决内存危机的救星,但不幸的是,情况将维持现状,甚至可能变得更糟。谷歌TurboQuant 不会解决或缓解内存危机。

今年三月,谷歌 推出了一种名为 TurboQuant 的新算法,该算法能显著压缩 KV 缓存。其结果是,AI 工作负载的内存需求实现了高达 6倍 的惊人节省。该算法一经公布,就有报道称内存价格出现了大幅下跌。
人们很容易将 谷歌的TurboQuant 与价格下跌联系起来,一些人因此陷入恐慌,低价抛售 DRAM 和内存模块(用于PC和笔记本电脑),担心 TurboQuant 会终结内存市场的繁荣。然而,事实并非如此;在最初的炒作热潮过去几天后,内存价格依然保持稳定,并且需求持续增长。
自 TurboQuant 推出以来,内存市场几乎没有受到明显冲击;事实上,来自AI公司的总需求一直在增长。在过去几天里,我们看到所有主要的AI公司都在扩张并推出新产品,以在智能体时代扩展AI规模。
而对于那些仍对 TurboQuant 抱有一丝希望的人来说,SK 海力士(SK Hynix) 首席财务官最近的声明彻底否定了它能满足AI需求的论调。
金祐贤(Kim Woo-hyun) - SK 海力士首席财务官 表示:“目前AI行业正在积极进行的软硬件优化,是内存需求增长的另一个驱动因素。尽管内存效率技术看似减少了个体设备的内存使用量,但实际上,它们正朝着一个方向演变,即最大化每单位内存可处理的上下文量。这预计将改善AI服务的经济性,形成一种良性循环,扩大整个AI服务市场,进而推动内存需求。”
SK 海力士 指出,诸如 谷歌TurboQuant 之类的软硬件优化只会增加内存需求,而非减少。顶级AI公司正在增加每单位内存可处理的上下文量,并且随着 CPU 成为智能体AI时代的新宠,内存的使用只会进一步加速。CPU 的需求已像此前的内存一样全面推高价格,但正如先前的 GPU 一样,目前丝毫看不到需求放缓的迹象。



