英伟达(NVIDIA)近日分享了一种全新改进的ReSTIR算法,能将路径追踪的性能提升2至3倍,为下一代游戏体验奠定了基础。

PC游戏正迅速采用路径追踪技术,以实现次世代的视觉保真度。正如光线追踪一样,英伟达同样是率先在PC上为路径追踪铺平道路的厂商。然而,与早期的光线追踪类似,路径追踪也面临着一项挑战,即对更快硬件的需求。正如我们在多款采用路径追踪的游戏中所见,即便是强大的RTX 5090这样的显卡,也只能达到30-40 FPS,并且需要大力借助DLSS超分辨率和帧生成技术的补充,才能提供可玩的帧率。
光线追踪最初在PC上出现时情况也是如此,如今它已能在现代硬件上流畅运行。甚至游戏主机也开始大规模引入光线追踪,尽管其设置大多局限于质量预设档,通常以30 FPS运行(在极少数情况下能达到60 FPS)。
作为PC视觉图形技术的先驱,英伟达现在正致力于将路径追踪推向新的高度。在一篇题为《“增强型ReSTIR路径追踪:实现更快、更鲁棒的ReSTIR路径追踪的算法进展”》的新研究论文中,英伟达提出了一套新的ReSTIR(或称时空重采样)算法,能够在提升2-3倍性能的同时,消除当前RT/PT方法中的视觉异常。
英伟达针对路径追踪的解决方案据称已接近“生产就绪”状态,并将空间复用的成本减半。增强型ReSTIR路径追踪算法还通过优化实现了性能与质量的提升,这些优化统一了直接光照和全局光照,同时利用了现有的色彩噪声和遮挡解除噪声抑制技术。完整的增强列表包括:
通过互逆邻居选择,将空间复用中的位移映射成本减半。
适应场景和材质的新光线足迹阈值。
通过样本复制映射减少相关性伪影。
通过统一直接光和间接光的ReSTIR处理来提升质量和降低成本。
其他通过减少色彩和遮挡解除噪声来提升性能和增强鲁棒性的优化。
表1展示了我们技术的性能表现,每一行都在林等人(2022年)公开源代码的基准之上增加了一项新功能或优化。我们首先测量了成本降低技术带来的加速效果,在四个测试场景中平均实现了2.74倍的加速。这些场景的选择反映了不同的几何和材质复杂度。各个场景的详细结果见补充材料。
为了进一步深入了解我们底层GPU优化的效果,我们使用NSight Graphics对歌剧院场景进行了性能分析。分析数据表明,第6.2.1至6.2.3节的优化减少了线程分歧,提高了GPU计算效率。具体而言:
SM(流式多处理器)线程束占用率从22.4%提升至31.1%。
每个线程束中的活动线程数从15.3增加至19.9。
线程束延迟从347k周期降低至241k周期。
所有这些改进均未改变采样器的行为。应用俄罗斯轮盘赌(第6.2.4节)后,这些指标进一步改善为:
34.9%的占用率。
每个线程束20.6个活动线程。
82k周期的延迟。
我们的方法还通过两项改动减少了相对于基准方案的存储占用:压缩ReSTIR路径追踪存储库,以及统一直接光照和间接光照的存储库。由于每个ReSTIR处理过程需要两组存储库以支持时间复用,这些改动将每像素的存储占用从基准实现(为ReSTIR DI使用16字节存储库)的2 × (88 + 16)字节减少到2 × 64字节。在1920×1080的渲染分辨率下,这将内存消耗从431 MB降低至265 MB。
很高兴看到英伟达正在提升路径追踪的性能。自RTX 40和RTX 50系列GPU发布以来,这项技术已变得愈发重要。展望未来,英伟达希望利用神经渲染技术和AI算法,进一步微调其游戏硬件的性能,以加速下一代视觉能力的实现。



