微软的DirectStorage API在GPU解压缩方面一直存在性能表现异常的情况。不过YouTube博主“Compusemble”声称英伟达(Nvidia)最新款GeForce RTX 5090显卡在处理GPU解压缩时表现优于上一代RTX 4090,其GPU解压缩与CPU解压缩之间的性能差距更小。该博主测试了《瑞奇与叮当:时空跳转》和《蜘蛛侠2》两款支持DirectStorage(DS)技术的游戏,分别在4K、1440P和1080P分辨率下对比了RTX 5090的GPU解压缩与CPU解压缩性能。需要注意的是,测试中未包含RTX 4090的对比数据,而此前普遍认为DirectStorage会导致性能损失。
在《瑞奇与叮当:时空跳转》的4K原生分辨率测试中,RTX 5090采用GPU解压缩时的平均帧率与CPU解压缩几乎持平——CPU解压缩仅领先0.96%,但在1%最低帧率方面却领先近10%。这表明在高GPU负载(如4K分辨率)场景下,采用GPU运行DirectStorage仍可能导致性能下降。而在1440P分辨率下情况反转:虽然优势幅度较小,但GPU解压缩在整体表现(特别是1%最低帧率)上更胜一筹——平均帧率高出1.19%,1%最低帧率领先5.26%。1080P分辨率下GPU解压缩优势继续扩大,平均帧率提升0.48%,1%最低帧率大幅领先11.11%。
然而《蜘蛛侠2》的测试结果却显示,在三种分辨率下CPU解压缩均占优势。4K分辨率时CPU解压缩使平均帧率提升8.2%,1%最低帧率提升10.53%;1440P分辨率下平均帧率领先3.53%,1%最低帧率优势达14.29%;1080P分辨率时平均帧率提高3.3%,1%最低帧率提升9.23%。
Compusemble指出,相较于老款RTX 4090,RTX 5090在GPU/CPU解压缩下的性能表现更为稳定。其早期测试视频显示,RTX 4090在《蜘蛛侠2》中切换解压缩方式时性能波动更大:4K分辨率下CPU解压缩使平均帧率提升10.34%,1%最低帧率提升17.95%;1440P分辨率时两项数据分别提升6.25%和18.87%;1080P分辨率下则提升3.25%和25.86%。
RTX 5090具有更强的原生计算能力(105 TFLOPS FP32对比83 TFLOPS)、显著提升的显存带宽(1.8TB/s对比1.0TB/s)以及增加33%的显存容量,这些硬件升级可能共同减轻了GPU解压缩的性能影响。该显卡配备512位宽显存接口和28Gbps GDDR7显存模块,显存带宽比RTX 4090高出78%。由于GPU解压缩需要将资源流式传输至显存进行处理,这一过程对内存系统压力极大。
当然,着色器计算能力也是影响因素——在较低分辨率下当5090更可能受限于CPU性能时,它仍有充足的计算余力处理解压缩任务。无论具体原因如何(架构改进可能也起到作用),5090对GPU解压缩的适应性明显优于4090。不过用户更期待的是更多游戏能通过DirectStorage技术同时提升加载速度和整体性能——毕竟相比帧率波动,稍长的加载时间反而更容易接受。