在本周的AI技术大会上,英伟达(Nvidia)发布了其下一代数据中心产品组合的新成员——鲁宾CPX(Rubin CPX)GPU。该芯片专为加速推理工作负载而设计,尤其侧重于计算性能而非带宽,将与明年首发的维拉·鲁宾(Vera Rubin)共同构成“解耦式”AI架构的另一支柱。然而最新芯片细节分析显示,这款AI加速器可能隐藏着比官方披露更多的信息,甚至有推测认为它可能为未来的RTX 6090奠定基础。

Cover Image

独立半导体分析师High Yield近日对官方宣传材料中的芯片渲染图进行了标注解读。虽然这仅是可能存在误差的艺术渲染图,但他发现了一个奇特现象:存在图形专用硬件模块。他在鲁宾CPX中发现完整的光栅化输出管线(ROP)、光栅单元甚至显示引擎——这些全都是与AI任务无关的组件。

标注显示该芯片包含16个图形处理集群(GPC),每个集群配备6个纹理处理集群(TPC),总计可达192个流式多处理器(SM)——与基于布莱克维尔(Blackwell)架构的RTX 5090数量持平。但令人惊讶的是,该芯片还集成256个ROP四条显示管线,这些本应专属于游戏GPU的组件占据了本可用于AI计算的宝贵晶圆面积。相比之下,驱动RTX 5090的GB202仅配备170个ROP和12个GPC。

英伟达计划将鲁宾CPX用于RTX 6090,极有可能沿用其惯用的部分功能单元禁用策略。即使禁用两个GPC,该芯片仍可提供约28,672个CUDA核心224个ROP,显著超越RTX 5090的21,760个CUDA核心和176个ROP。若维持从Blackwell继承的每个GPC配置8个TPC的设计,理论上可扩展至32,768个CUDA核心。即使考虑约10%的良率损耗,游戏版芯片仍将保持28,000+ CUDA核心规模,预计可实现28-30%的代际性能提升——这还未计入时钟频率提升和架构优化带来的增益。

渲染图还显示该芯片采用512位内存总线GDDR7显存,可能配备128MB二级缓存。这将使有效内存带宽提升至近2TB/s,明显超越同样采用512位接口的RTX 5090的1.8TB/s。此外,对PCIe 6.0的支持以及视频引擎的存在,都表明鲁宾CPX虽然当前定位为AI加速器,但很可能成为未来游戏GPU的技术跳板。

若该芯片确系RTX 6090的前身,它将代表英伟达有史以来规模最大、功能最完整的芯片设计。凭借多达256个ROP(远超GB202的176个),鲁宾CPX理论上可在高分辨率传统光栅化渲染中实现显著性能提升,同时改善像素处理能力。

按照规划,鲁宾CPX将于2026年底维拉·鲁宾发布后上市,共同组成英伟达宣称的“史上最先进、最高效的AI推理解决方案”。若沿用既往发布节奏,RTX 6090预计将在2027年国际消费电子展(CES)亮相。时间线虽存在契合度,但目前仍需保持审慎态度。


文章标签: #英伟达 #鲁宾CPX #RTX6090 #AI加速器 #GPU芯片

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。