采用第二代Transformer模型的DLSS(深度学习超级采样)4.5技术现已面世,NVIDIA(英伟达)的Tensor核心能利用此AI模型在游戏中提升画质。与上一代相比,第二代Transformer模型对硬件的要求更高,且主要用于提升画质而非增加帧率。此前,我们从DLSS 4.0相比DLSS 3.5带来的巨大画质飞跃中,已看到它在旧款RTX显卡上造成了明显的性能下降。

有报道称,最新的DLSS 4.5占用资源更多,很容易使性能降低约20%。据@mpr_reviews的报告,使用RTX 3080 Ti在4K分辨率和RT Ultra预设下运行《赛博朋克2077》,并开启DLSS质量模式时,性能竟下降了惊人的24%。在使用DLSS 4.0时,平均帧率超过40帧,而DLSS 4.5将其拉低至约32帧。在1440p分辨率和相同预设下,性能下降14%,有所降低,但在关闭光线追踪后,整体性能下降反而增至20%。
这与其它用户在相关讨论中证实的情况一致,其中包括一位使用RTX 4060笔记本显卡的用户,其性能也出现了近16%的下降。
这种情况是意料之中的。与RTX 50系列不同,前几代RTX显卡并未原生支持FP4/FP8精度(RTX 40系列支持FP8)。据NVIDIA(英伟达)的官方文档显示,RTX 40系列使用最新的Transformer模型时,其显存占用量应比前几代要少。据报道,最新的DLSS 4.5在RTX 40/50系列显卡上需要多占用40-53%的显存,而在RTX 20和RTX 30系列显卡上,显存占用量的增幅高达87-103%。
因此,那些已在使用8GB显存显卡的用户将面临真正的性能瓶颈,尤其是当他们已经受到不支持新版Transformer模型所用的FP8精度影响时。
NVIDIA(英伟达)的Jacob Freeman(雅各布·弗里曼)确认,新的DLSS 4.5模型所需的计算量是之前的5倍,只有具备FP8精度的硬件(如RTX 50和RTX 40系列)才能完全满足这一资源需求。
在RTX 50系列上,启用DLSS 4.5会导致2-3%的性能下降,而画质提升效果却非常显著。对于较旧的RTX 20和RTX 30系列,结果已如上所述。DLSS 4.5在那些能提供额外性能余量的游戏中仍然能产生巨大影响。如果用户使用RTX 20/30/40系列显卡在旧款游戏中已经能达到100-200帧的良好帧率,那么启用DLSS 4.5以牺牲部分帧率换取更好的画质是有意义的。
然而,如果用户拥有显存容量更大的显卡,例如RTX 2080 Ti、RTX 3080 Ti等,DLSS 4.5将带来显著更好的画质,这正如一位使用其RTX 4060笔记本电脑显卡对游戏进行基准测试的用户所展示的那样。我们可以清楚地看到整体细节更加锐利,包括草地、树木、岩石和角色。



