英伟达(Nvidia)最新发布的Blackwell架构宣称支持一系列人工智能驱动的“神经渲染”功能,其中最具突破性的是神经纹理压缩技术(NTC)。随着游戏开发者追求更逼真的视觉效果,纹理贴图体积不断膨胀,给显存等有限硬件资源带来巨大压力。近日,有技术爱好者分别在英伟达和英特尔测试平台上展示了这项纹理压缩技术的实际效果,其压缩效率提升显著——该技术最终将帮助开发者在有限显存条件下实现更多功能,或在同等GPU内存容量下呈现更丰富的视觉效果。

Cover Image

相比当前广泛采用的基于块状的纹理压缩技术,NTC承诺能在显著减小磁盘和内存中纹理体积的同时,提升渲染场景的画质表现。其核心技术在于允许开发者针对场景中的每种材质,调用专门优化的轻量级神经网络进行纹理解压缩。

为实现此类神经渲染功能,英伟达、微软等厂商联合开发了名为“协同向量”(Cooperative Vectors)的DirectX特性,使开发者能精细调用现代GPU中的矩阵加速引擎(英伟达称其为Tensor Core,英特尔命名为XMX引擎,AMD则称为AI加速器)。

尽管尚未有商业游戏应用NTC技术,但相关生态正在快速成型。YouTube博主Compusemble发布的新视频展示了这项技术的广阔前景,视频中对比演示了英特尔和英伟达两套系统的实测表现。

在英特尔演示中,采用NTC解压缩的霸王龙纹理贴图,其清晰度与锐利度明显优于传统块压缩方式,效果几乎接近未压缩的原生纹理。测试平台搭载RTX 5090显卡时,4K分辨率下平均处理时长从0.045毫秒增至0.111毫秒(增幅2.5倍),但这仅占单帧渲染时间的极小部分。值得注意的是,若禁用协同向量功能,NTC处理时间将激增至5.7毫秒,证明矩阵加速引擎是该技术实用化的关键

英伟达的演示则凸显了NTC对显存占用的优化效果:演示中飞行头盔的未压缩纹理为272MB,传统块压缩降至98MB,而NTC技术进一步锐减至11.37MB。与英特尔演示类似,启用NTC会带来轻微的计算开销,但相较于其带来的资源利用效率提升,这种代价显然物超所值。

这些演示表明,神经纹理压缩技术将为开发者和玩家带来革命性改变——无论是降低特定场景的显存压力,还是在固定资源条件下实现更复杂的视觉效果。业界期待开发者能尽快将这项技术投入实际应用。


文章标签: #显卡 #AI #游戏 #显存 #渲染

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。