在Nvidia Blackwell RTX 50系列显卡发布之后,大家对一些新技术产生了困惑。在随后的现场问答环节中,媒体向NvidiaCEO黄仁勋询问了DLSS 4以及一些神经渲染技术的细节,以便让大家更好地理解AI在Blackwell架构中的运用,以及这对不同应用场景的影响。
DLSS 4的一个重要性能提升点是多帧生成。在DLSS 3时代,Nvidia会先渲染两帧画面,再利用AI技术插值生成一个中间帧。这种做法虽然能在一定程度上提升帧率,但会给游戏渲染流程带来延迟,还会引发帧率节奏不稳的问题。一开始,媒体以为DLSS 4的多帧生成是类似的原理,只不过不是生成一个中间帧,而是生成两三个,即进行多帧插值。但后来发现这种理解是错误的。
当媒体向黄仁勋询问DLSS 4的多帧生成具体是怎么运作的,以及是否还在使用插值技术时,他却表示DLSS 4是“预测未来”而非“插值过去”,这完全改变了我们对它的认知,也意味着它对硬件能力的要求以及在延迟方面的表现都会有所不同。
虽然在没有新的用户输入的情况下,还是会进行一些运算,但Reflex 2的变形功能或许能在一定程度上缓解这个问题。DLSS 4会基于之前渲染的帧、运动向量以及其他数据来生成新帧,从而创造出更流畅的游戏体验。而且,它还有新的硬件要求,以更好地维持帧率节奏。
媒体还没能亲自体验,所以无法确切地比较DLSS 4的多帧生成和DLSS 3的帧生成以及正常渲染的效果。听起来似乎还是存在延迟的问题,但这种延迟到底有多大,尤其在不同档次的RTX 50系列显卡上会是什么感觉,这是个很关键的问题。 从DLSS 3的经验来看,如果你的生成FPS只有40,比如,即使画面看起来还算流畅,但操作起来会感觉很卡顿、很延迟,因为用户输入的采样频率只有20 FPS。对于DLSS 4来说,可能意味着你有80 FPS的生成帧率,但用户采样频率还是20 FPS。简单来说,我们通常觉得至少需要40 - 50 FPS的采样率,游戏用帧生成技术时才会感觉操作灵敏。
有了多帧生成技术,可能就需要160 - 200 FPS的生成帧率,才能获得类似的流畅操作体验。这在240 Hz的显示器上可能会非常棒,我们也期待看到这样的效果,但在60 Hz甚至120 Hz的显示器上,多帧生成技术可能就没那么出色了。
媒体还问了关于展示的神经纹理和渲染技术的问题。Nvidia展示了一些数据,标准材质的内存使用为48MB,而使用“RTX神经材质”后降低到了16MB。但这具体意味着什么呢,又会怎样影响游戏体验呢?媒体特别想知道这是否能帮助那些显存没那么多的显卡,比如只有8GB显存的RTX 4060。
遗憾的是,黄仁勋表示这些神经材质需要内容创作者进行专门的实现。他说Blackwell有新功能,能让开发者和艺术家把着色器代码和神经渲染指令混合到材质里。现在材质描述变得很复杂,用数学方式描述它们也很困难。不过黄仁勋也提到,“AI可以学会为我们做这些事”。
这些新功能可能在上一代GPU上没法用,因为它们没有将着色器代码和神经代码混合所需的硬件能力。或者也许能用,但性能不会那么好。所以要想获得全部好处,就得用新的50系列显卡。而且神经材质需要内容方面的投入,所以开发者得专门采用这些新功能。
这就意味着,比如我们将来有了RTX 5060 8GB显卡,对于很多现有游戏来说,8GB的显存可能还是不够用。同样,RTX 4060和4060 Ti的8GB显存也不会因为神经渲染技术而重新焕发活力。至少这是我们目前的理解。不过也许未来某个AI网络能学会帮我们做这些事。