AMD正在为即将推出的RDNA 5架构GPU进行指令级优化,这将使该公司能够在特定工作负载下实现GPU性能翻倍。AMD的RDNA 5产品线将有效利用双发射VALU,使GPU轻松达到理论峰值性能。

RDNA 5将是架构和指令级属性的彻底重构,这也是我们许多人对其产品线细节浮出水面感到兴奋的原因。虽然现在讨论具体型号还为时过早,但密切关注Linux相关补丁的平台Coelacanth-Dream已经注意到RDNA 5一项有趣的改进,其目标是通过双发射VALU使算术运算速度翻倍。这本质上将使RDNA 5有效地“翻倍”FP32能力,影响多种工作负载。
有趣的是,双发射VALU对RDNA 5来说并非新事物;AMD在RDNA 4和RDNA 3中也引入了它。双发射VALU拥有两条ALU通道,允许GPU每个时钟周期执行两条指令;然而,在最近的几代产品中,游戏引擎编译器没有有效的方法来排列其代码以优化双发射VALU。这实质上意味着,即使硬件能力存在,RDNA 4/3也无法有效地对任务进行分组。然而,在RDNA 5上,AMD引入了FMA,简单来说,它允许指令更容易地在双通道上发射。
FMA将使编译器能够轻松配对复杂的ALU操作并将其发送到计算通道,这就是“性能”实质上可能翻倍这一说法的由来。RDNA 5将通过按设计初衷利用双发射VALU来达到理论峰值性能。对于游戏玩家而言,这将转化为标准光栅化游戏中更高、更稳定的帧率。FMA指令对于神经和AI工作负载也至关重要,可以补充AI驱动的超分辨率技术和帧生成技术。
Coelacanth-Dream已经更深入地讨论了FMA、双发射VALU和其他技术细节,因此如果您对具体细节感兴趣,最好去查看一下。我们将密切关注AMD未来如何发展RDNA 5,但看来软件栈的改进将在很大程度上影响其发布成果。



