科隆展试玩FLASK,硬核自动战斗肉鸽游戏前瞻
阅读全文

锤刻创思寰宇网
英伟达(NVIDIA)公布了其下一代鲁宾(Rubin)AI平台的全新细节,该平台将采用全新的Vera CPU以及配备高达128 GB GDDR7显存的新型鲁宾CPX芯片。
今天,英伟达发布了专为海量上下文处理而设计的新型GPU——NVIDIA鲁宾CPX。它使AI系统能够以突破性的速度和效率处理百万token级别的软件编码和生成式视频任务。
鲁宾CPX将与NVIDIA Vera CPU和鲁宾GPU在新一代NVIDIA Vera Rubin NVL144 CPX平台中协同工作。这款集成的NVIDIA MGX系统可提供高达8百亿亿次(Exaflops)的AI算力,其AI性能是NVIDIA GB300 NVL72系统的7.5倍,并在单个机架内提供100 TB的高速显存和每秒1.7 PB的内存带宽。对于希望复用现有Vera Rubin 144系统的客户,还将提供专用的鲁宾CPX计算托盘。
鲁宾CPX为长上下文处理提供了最高的性能和token收益,远超当前系统设计所能处理的范围。这将使AI编程助手从简单的代码生成工具转变为能够理解和优化大型软件项目的复杂系统。
对于视频处理,AI模型处理一小时的内容可能需要多达100万个token,这突破了传统GPU计算的极限。鲁宾CPX将视频解码器、编码器以及长上下文推理处理集成于单一芯片,为视频搜索和高质量生成式视频等长格式应用提供了前所未有的能力。
基于NVIDIA鲁宾架构构建的鲁宾CPX GPU采用高成本效益的单片晶粒设计,集成了强大的NVFP4计算资源,并经过优化,可为AI推理任务提供极高的性能和能效。
鲁宾家族的这一全新成员是一类专为AI任务(如百万token软件编码和生成式AI)构建的新型GPU。据称,这些新GPU将带来“突破性”的速度和效率。
NVIDIA鲁宾CPX芯片将与英伟达下一代Vera CPU(Grace CPU的继任者)一同部署在Vera Rubin NVL 144 CPX平台中。这是一个MGX系统,可提供高达8百亿亿次的AI算力,比Grace Blackwell GB300 NVL72平台提升7.5倍。该系统还将提供100 TB的高速显存和每秒1.7 PB的内存带宽,其Attention性能是GB300 NVL72的3倍。
Vera Rubin NVL144平台与Vera Rubin NVL144 CPX平台的区别在于是否包含CPX芯片。非CPX平台包含四个鲁宾GPU和两个Vera CPU,提供3.6百亿亿次的NVFP4算力、每秒1.4 PB的HBM4带宽和75 TB的容量,计划于2026年下半年上市。
因此,CPX与非CPX平台的对比情况如下:
NVFP4算力:8.0 对比 3.6 百亿亿次
内存带宽:每秒1.7 PB 对比 每秒1.4 PB
内存容量:100 TB 对比 75 TB
上市时间:2026年底 对比 2026年下半年
NVIDIA Vera Rubin CPX平台相较于Grace Blackwell平台的一些特性:
AI算力提升7.5倍(8百亿亿次 NVFP4)
带宽提升3.0倍(1.7 PB/s 带宽)
内存提升4.0倍(GDDR7提供150 TB)
具体到芯片,NVIDIA鲁宾CPX GPU将提供30 PFLOPs的NVFP4 AI算力,并配备高达128 GB的GDDR7显存。在数据中心平台选择GDDR7显存是一个有趣的决定。英伟达表示,出于成本效益考虑,鲁宾CPX选择了GDDR7而非HBM。这些芯片还具备4倍于以往的NVENC和NVDNC能力,扩展的视频能力将对生成式AI任务大有裨益。
有趣的是,虽然鲁宾平台将采用2倍光罩尺寸的GPU,鲁宾Ultra将采用4倍光罩尺寸的GPU,但CPX芯片将采用单晶粒和单片配置。其制程工艺尚未公布,但预计鲁宾AI芯片将采用台积电(TSMC)的N3或N2制程。
此外,该芯片似乎也提前揭示了面向“GeForce”和“PRO”平台的消费级鲁宾芯片的可能样貌。CPX很可能就是最终取代Blackwell GB202的芯片的一个变体或相同版本。这款GR20X芯片拥有相同的192个SM,最大支持512位总线配置(8个64位IMC),并支持高达4 Gb的集成电路(IC)。关于该芯片的更多细节将很快公布。
英伟达预计首批鲁宾CPX系统将于2026年底上市,而Vera Rubin本身预计将很快投入生产,并计划在2026年GTC大会上正式发布。