英伟达鲁宾CPX芯片细节曝光，含光栅单元与显示管线

在本周的AI技术大会上，英伟达（Nvidia）发布了其下一代数据中心产品组合的新成员——鲁宾CPX（Rubin CPX）GPU。该芯片专为加速推理工作负载而设计，尤其侧重于计算性能而非带宽，将与明年首发的维拉·鲁宾（Vera Rubin）共同构成“解耦式”AI架构的另一支柱。然而最新芯片细节分析显示，这款AI加速器可能隐藏着比官方披露更多的信息，甚至有推测认为它可能为未来的RTX 6090奠定基础。

Cover Image

独立半导体分析师High Yield近日对官方宣传材料中的芯片渲染图进行了标注解读。虽然这仅是可能存在误差的艺术渲染图，但他发现了一个奇特现象：存在图形专用硬件模块。他在鲁宾CPX中发现完整的光栅化输出管线（ROP）、光栅单元甚至显示引擎——这些全都是与AI任务无关的组件。

标注显示该芯片包含16个图形处理集群（GPC），每个集群配备6个纹理处理集群（TPC），总计可达192个流式多处理器（SM）——与基于布莱克维尔（Blackwell）架构的RTX 5090数量持平。但令人惊讶的是，该芯片还集成256个ROP和四条显示管线，这些本应专属于游戏GPU的组件占据了本可用于AI计算的宝贵晶圆面积。相比之下，驱动RTX 5090的GB202仅配备170个ROP和12个GPC。

若英伟达计划将鲁宾CPX用于RTX 6090，极有可能沿用其惯用的部分功能单元禁用策略。即使禁用两个GPC，该芯片仍可提供约28,672个CUDA核心和224个ROP，显著超越RTX 5090的21,760个CUDA核心和176个ROP。若维持从Blackwell继承的每个GPC配置8个TPC的设计，理论上可扩展至32,768个CUDA核心。即使考虑约10%的良率损耗，游戏版芯片仍将保持28,000+ CUDA核心规模，预计可实现28-30%的代际性能提升——这还未计入时钟频率提升和架构优化带来的增益。

渲染图还显示该芯片采用512位内存总线的GDDR7显存，可能配备128MB二级缓存。这将使有效内存带宽提升至近2TB/s，明显超越同样采用512位接口的RTX 5090的1.8TB/s。此外，对PCIe 6.0的支持以及视频引擎的存在，都表明鲁宾CPX虽然当前定位为AI加速器，但很可能成为未来游戏GPU的技术跳板。

若该芯片确系RTX 6090的前身，它将代表英伟达有史以来规模最大、功能最完整的芯片设计。凭借多达256个ROP（远超GB202的176个），鲁宾CPX理论上可在高分辨率传统光栅化渲染中实现显著性能提升，同时改善像素处理能力。

按照规划，鲁宾CPX将于2026年底维拉·鲁宾发布后上市，共同组成英伟达宣称的“史上最先进、最高效的AI推理解决方案”。若沿用既往发布节奏，RTX 6090预计将在2027年国际消费电子展（CES）亮相。时间线虽存在契合度，但目前仍需保持审慎态度。

搜索结果如下

阅读全文

英伟达鲁宾CPX芯片细节曝光，含光栅单元与显示管线

也可以看看

PS5迎来必玩佳作，Xbox独占游戏《午夜之南》现已登陆

阅读全文

漫威票房惨败之作，被低估的《惊奇队长2》

阅读全文

《黑袍纠察队》主创确认，第五季将迎来系列最高危局

阅读全文