AMD 进一步详述了其 DGF(Dense Geometry Format,密度几何格式)技术。该技术与 英伟达(NVIDIA) 的 RTX Mega Geometry 相抗衡,能在光线追踪游戏中提供大幅提升的几何体数量,同时还引入了为未来 RDNA GPU 设计的新型压缩方法。

随着游戏几何体规模不断增长,AMD 的 DGF 和 英伟达(NVIDIA) 的 RTX Mega Geometry 等技术在驱动先进光线追踪游戏中变得至关重要。
去年,AMD 发布了其 DGF(Dense Geometry Format,密度几何格式)技术。该技术旨在通过流式传输几何簇而非完整场景,来处理海量多边形数量。其原理很简单:将标准三角形网格压缩并存储到小型网格(meshlet)中。一个 DGF 网格包含 64 个顶点和 64 个三角形,存储在一个包含元数据的 128 字节 DGF 块中。一组 DGF 块构成一个网格。
现在,AMD 为 DGF 披露了更多细节,称其有潜力为游戏中的光线追踪渲染、内容创作、虚拟制作以及其他多种实时 3D 工作负载,带来几何细节的巨幅提升。
随着 虚幻引擎5(Unreal Engine 5) 中的 Nanite 技术出现,复杂模型的门槛已被抬高。这些技术引入了小型三角形格式,在某些情况下通过计算着色器进行光栅化或软件光栅化,这给光线追踪渲染带来了挑战。
在光线追踪 API 中使用压缩格式来使这些三角形可行,需要解码过程,这会影响内存延迟,导致不稳定、卡顿和性能下降。即使采用硬件加速,当前的结构对于支持未来的内容来说也过于庞大。据 AMD 称,当前用于光线追踪加速的“黑盒”API 结构存在一些限制,包括:
“预构建”内存的分配必须根据最差的压缩率来计算大小,这增加了最小占用空间,并使构建过程更加复杂和低效。
实现必须存储足够的信息,以精确还原输入三角形的顶点顺序,以供索引引用,这会增加内存消耗。
实现必须将输入转换为硬件格式,最终影响性能、芯片面积或功耗。强制性的运行时转码会阻碍实现更密集但更难以编码的设计方案,间接导致内存消耗增加。
为了解决这个问题,AMD 与 三星(Samsung) 及多家软件开发商合作,创建了一种标准且高效的几何压缩格式。该格式是 DGF 的一部分,被称为 DGF“超级压缩”。
DGF 超级压缩(DGF SuperCompression)进一步压缩了 DGF 数据,可将存储成本降低高达 30%。该技术也适用于非 DGF 硬件,因此尽管旧款 RDNA GPU(如 RDNA 4 及更早代际)支持 DGF 超级压缩,可将存储大小减少 30%,但未来如 RDNA 5 等 GPU 将提供更全面的支持,从而获得更显著的提升。
AMD 表示:“我们通过引入 DGF 超级压缩(DGFS)来解决这个问题。这是一个软件系统,可进一步压缩 DGF 数据以降低其存储成本。经 DGFS 编码的几何体不再可以直接被硬件消费,但可以显著减小体积。DGFS 能够精确重建给定的一组输入 DGF 块,并支持高效解码为传统的顶点和索引缓冲区,这使得 DGFS 内容能在非 DGF 硬件上运行。”
AMD 公布了一些原始存储占用数据,以及在其当前一代 Radeon RX 9070 XT(RDNA 4) 显卡上,对多种模型应用 DGF 块和未压缩 DGFS 流后所节省的空间:
螃蟹模型:2.14 百万三角形,DGF 大小 10.22 MB,DGFS 大小 8.48 MB,节省 17.06%
龙模型:7.22 百万三角形,DGF 大小 29.25 MB,DGFS 大小 20.15 MB,节省 31.09%
小雕像模型:10.00 百万三角形,DGF 大小 40.99 MB,DGFS 大小 29.31 MB,节省 28.48%
佛像模型:1.09 百万三角形,DGF 大小 4.94 MB,DGFS 大小 3.95 MB,节省 20.03%
自行车模型:1.68 百万三角形,DGF 大小 6.96 MB,DGFS 大小 5.54 MB,节省 20.47%
通过 DGF 适配器后,节省效果进一步提升:
螃蟹模型:DGF 大小 7.19 MB,DGFS 大小 5.73 MB,节省 20.29%
龙模型:DGF 大小 20.15 MB,DGFS 大小 15.67 MB,节省 22.22%
小雕像模型:DGF 大小 28.65 MB,DGFS 大小 23.31 MB,节省 18.61%
佛像模型:DGF 大小 3.35 MB,DGFS 大小 2.63 MB,节省 21.34%
自行车模型:DGF 大小 4.56 MB,DGFS 大小 3.69 MB,节省 19.04%
DGF 解码性能:
螃蟹模型:网格解码 0.03 秒,DGF 解码 0.05 秒
龙模型:网格解码 0.09 秒,DGF 解码 0.15 秒
小雕像模型:网格解码 0.15 秒,DGF 解码 0.22 秒
佛像模型:网格解码 0.02 秒,DGF 解码 0.03 秒
自行车模型:网格解码 0.02 秒,DGF 解码 0.04 秒
解码时间测试系统配置:AMD Ryzen 9 7950X 16 核处理器、64GB DDR5 6000 内存、AMD Radeon RX 9070 XT 显卡、MSI PRO PRO X670-P WIFI 主板、Microsoft Windows 11 2025 更新版。
毫无疑问,几何体在次世代游戏中将迎来巨大飞跃。《巫师4》(The Witcher IV)便是一个例子,即便是在几个月前展示的演示版本中,其画面也已美轮美奂。此外,英伟达(NVIDIA) 已在《心灵杀手2》(Alan Wake 2)中应用了 RTX Mega Geometry,该技术也将登陆《控制:共鸣》(Control Resonant)。AMD 的 DGF(密度几何格式)为其未来的神经渲染架构(例如预计将登陆 PC 和次世代游戏主机的 RDNA 5 系列)铺平了道路。
虽然尚无关于我们何时能看到 AMD 下一代架构的具体时间表,但 AMD 已经讨论了其与 索尼(Sony) 合作的“紫水晶计划”(Project Amethyst)中的一些精彩特性,例如 FSR 钻石(FSR Diamond)等。



