Nvidia在2025年CES主题演讲中正式宣布了其即将推出的GeForce RTX 50系列Blackwell显卡,引起了广泛关注。虽然旗舰级的RTX 5090性能强大,但对于许多消费者来说,价格更亲民的RTX 5070(售价549美元)才是真正值得关注的明星产品。自RTX 4070发布以来,它一直是市场上最受欢迎的显卡之一,现在其替代者RTX 5070即将登场。
Nvidia声称,RTX 5070的性能将接近RTX 4090,但价格仅为后者的三分之一,功耗也略高于一半。然而,从实际的规格对比来看,RTX 5070要想在所有工作负载中完全匹敌RTX 4090,似乎有些过于乐观。Nvidia在Blackwell系列中加大了对AI的投入,寄希望于DLSS 4和其他神经渲染技术来弥补性能上的差距。但在许多现有游戏中,硬件的原始性能仍然至关重要,除非有驱动程序方面的创新能够在不需要游戏补丁和更新的情况下实现更高的性能。
RTX 5070将拥有48个流处理器组(SM),相较于RTX 4070的46个SM,提升幅度并不大,与RTX 4090的128个SM相比更是差距明显。在FP32图形计算能力方面,RTX 5070为31 TFLOPS,RTX 4070为29 TFLOPS,而RTX 4090则高达83 TFLOPS。在不借助DLSS 4等技术的情况下,RTX 5070很难在性能上接近RTX 4090。
显存容量也是一个重要的考量因素。RTX 4090配备了24GB的显存,而RTX 4070和RTX 5070都只有12GB。虽然目前大多数游戏在12GB显存下运行无虞,但像《夺宝奇兵与古老之圈》这样的游戏在4K分辨率下开启全RT且不进行缩放时,显存使用量就会超过12GB。未来可能会有更多游戏在更高分辨率和设置下对显存提出更高的要求。
此时,“RTX神经材质”技术或许能发挥重要作用,它类似于Nvidia在2023年提出的神经纹理压缩技术的完全实现。不过,这项技术可能无法适用于所有游戏,如果能有驱动程序方面的解决方案使其广泛应用,那将是一个巨大的进步。如果没有这项技术,RTX 5070的12GB显存将限制其与RTX 4090的性能差距。
带宽方面,RTX 4090配备了21 Gbps的GDDR6X显存,接口宽度为384位,而RTX 5070则配备了28 Gbps的GDDR7显存,接口宽度为192位。因此,RTX 4090的带宽为1008 GB/s,RTX 5070为672 GB/s。在不借助神经纹理压缩等技术的情况下,RTX 5070在高分辨率下的表现将难以与RTX 4090相媲美。
在AI工作负载方面,如大型语言模型(LLM),显存容量同样至关重要。量化技术虽然能在一定程度上降低对显存的需求,但目前还没有针对LLM的神经压缩技术。拥有24GB显存的RTX 4090能够加载比RTX 5070更大的LLM模型,而RTX 5070在AI模型大小方面只能与RTX 4070相当。
不过,在AI计算性能上,RTX 50系列显卡的表现值得期待。RTX 50系列将支持FP4数字格式,而且每个张量核心的计算能力是RTX 40系列的两倍。虽然这还不足以让RTX 5070在理论性能上超越RTX 4090,但差距已经缩小到大约25%。如果某些应用能够在RTX 5070上利用FP4,而RTX 4090需要使用FP8,那么RTX 5070在这些应用中的表现可能会更好。不过,在INT8 TOPS方面,RTX 4090仍然占据优势。
价格无疑是RTX 5070的一大优势。许多玩家无法负担1599美元的RTX 4090,更不用说因稀缺性导致价格飙升至2000美元以上的情况。相比之下,549美元的RTX 5070更具吸引力。Nvidia的xx70级显卡一直是主流玩家的理想选择,RTX 5070有望延续这一传统。即使它无法在所有游戏中超越RTX 4090,只要能够持续提供接近RTX 4080水平的性能,就足以在市场上取得巨大成功。
DLSS 4技术是RTX 50系列显卡的一大亮点。虽然我们还没有实际体验过多帧生成功能,但对其效果持谨慎态度。DLSS 4能够在两个渲染帧之间生成多达三帧,这可能会增加延迟。不过,DLSS 4生成这些帧的速度更快,因此最终的延迟可能不会比DLSS 3帧生成更糟,只是增加了额外的帧。
DLSS 4在超采样和光线重建方面的增强和升级更为值得关注。此前,DLSS一直使用卷积神经网络(CNN)进行AI训练和推理。现在,DLSS 4引入了基于变换器的模型,可以应用于任何现有的DLSS 2/3游戏。变换器模型在AI领域取得了革命性的进展,其在DLSS中的应用效果令人期待。Nvidia长期以来一直声称DLSS的渲染效果“优于原生”,DLSS 4的变换器模型有望实现这一承诺。不过,这项技术也可以在现有的GPU上运行,因此可能不会成为RTX 50系列独有的杀手级功能。
总的来说,虽然RTX 50系列显卡在光线追踪方面有所提升,但其最大的亮点仍然是AI功能。DLSS软件的不断进步,使得AI在RTX系列显卡中的重要性愈发凸显。无论多帧生成功能是否能成为杀手级应用,对于尚未拥有40系列显卡的用户来说,RTX 50系列,尤其是RTX 5070,都将是一个极具吸引力的升级选择。