AMD2025年Hot Chips大会上进一步详解了其RDNA 4 GPU架构、模块化SoC设计以及全新的内存与带宽压缩技术。

Cover Image

今年2月架构首次发布时,我们已对其进行了全面深度解析。此次AMD提供了更多细节。在深入探讨其模块化SoC特性之前,先了解一些新强调的功能。

AMD特别指出,中低端RDNA 4 GPU SoC将采用LPDDR内存。他们表示,尽管LPDDR功耗更低,但其提供的带宽仍不足,且此类芯片所需的布线面积更大,从而会增加封装尺寸。因此,这解释了为何LPDDR不适合用于显卡。

当被问及与RDNA 3相比内存带宽较低的问题时,AMD回应称,内存带宽取决于工作负载,他们已对RDNA 4的图形架构进行了充分优化,从而降低了对带宽的需求。

此次在Hot Chips大会上公布的RDNA 4 GPU架构新细节主要围绕其模块化SoC架构。AMDRDNA 4被设计为一种灵活的SoC芯片,可衍生出多种配置,用于其Radeon产品。该部分由AMDSoC架构师Laks Pappu(负责Instinct数据中心GPU,并曾领导RDNA 4及其后续系列的SoC架构团队)介绍。这表明未来的RDNA 5 / UDNA系列很可能采用类似的模块化SoC方案。

首先来看数据流图,其中展示了Navi 4X SoC内的多个着色器引擎(Shader Engine)。每个着色器引擎包含多个工作组处理器(WGP),每个WGP又包含双计算单元(Compute Unit)。

它们通过GPU端的GL2缓存以及全新升级的Infinity Fabric(一致性互连)与内存控制器和末级缓存(LLC)通信。SoC内设有多个一致性站点(Coherent Station), alongside LLC和双通道内存控制器。内存控制器连接至PCB上的GDDR6显存。Infinity Fabric1.5-2.5 GHz的频率运行,带宽为每时钟周期1KB

接下来是模块化SoC设计,它能够衍生出更小的SoCAMD用红线标出了芯片的模块化切割点,该设计可扩展至不同SKU。图中红线以下部分是为Navi 44配置的芯片,包含两个着色器引擎和四个GDDR6128位)内存控制器,以及其他I/O控制器。这种架构既可向上扩展,也可向下缩减,或许我们将在下一代RDNA GPU中看到更大的SoC

只需添加更多的着色器引擎(SE)、L3缓存、Infinity Fabric互连和GDDR内存控制器,即可将芯片扩展至更高端的SKU,例如用于顶级显卡RX 9070 XTNavi 48。这种模块化还实现了更高的安全等级,允许对组件安全控制器、电源管理和MPI(微控制器)进行访问控制和不同级别的权限划分。可靠性、可用性和可服务性(RAS)被嵌入到此模块化芯片的各个组件中。

AMD还深入介绍了RDNA 4 SoC的中心压缩与解压缩算法。借助新技术,AMDRDNA 4 GPU在某些光栅化工作负载中性能提升达15%Infinity Fabric带宽减少25%(从而降低功耗),并且无需软件感知压缩算法(完全由硬件处理)。

AMD再次强调了其RDNA 4 GPU模块化SoC设计的灵活可配置性。该模块化架构为AMD提供了熔断选项,可根据市场需求衍生出多个产品SKU。他们设有四种 harvest 级别,可产生多种配置:

  • 着色器引擎(SE) Harvest

  • 工作组处理器(WGP) Harvest

  • 非对称 Harvest(可能包括加权的像素着色器分配和计算着色器分配)

  • 内存器件 Harvest(单器件粒度 / 64位粒度)

目前,AMD提供了四款Navi 48和三款Navi 44SKU,但RDNA 4的模块化SoC特性能够支持未来的更多配置。


文章标签: #AMD #RDNA4 #SoC #GPU #模块化

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。