英伟达(NVIDIA)出人意料地推出了一类“全新级别”的AI GPU,其鲁宾CPX(Rubin CPX)AI芯片在与机架级集群结合时能提供巨大的推理能力。

Cover Image

这款GPU将采用机架级配置,可扩展至全新性能水平。该公司意识到AI推理能力可能是下一个需要聚焦的计算领域,因此正式发布了“CFX”产品线下的新型AI芯片,首款产品即来自鲁宾系列。

在AI基础设施峰会上亮相的鲁宾CPX GPU专注于长上下文AI应用,更重要的是它将与鲁宾GPU及维拉(Vera)CPU协同运行。英伟达宣称该芯片将为高效执行AI推理带来“革命性突破”。

规格方面,鲁宾CPX具备30 petaFLOPs的NVFP4算力,配备128 GB GDDR7显存。它将应用于专属的英伟达维拉鲁宾NVL144 CPX机架,该平台集成144个鲁宾CPX GPU、144个鲁宾GPU及36个维拉CPU,可提供高达8 exaFLOPs的NVFP4算力。仅此一项数据就比布莱克维尔Ultra(Blackwell Ultra)高出7.5倍。结合Spectrum-X以太网等技术,英伟达计划实现百万令牌级别的AI推理工作负载,突破性能新高度。

该平台据称可带来“30至50倍投资回报率”,维拉鲁宾NVL144 CPX机架将打破“构建下一代生成式AI应用”存在的计算壁垒。鲁宾CPX也将提供其他配置方案(具体尚未公布),由于采用GDDR7显存而非HBM,该芯片被视为相对低成本的解决方案。

英伟达正全面覆盖AI产业各领域,令竞争对手难以超越。随着明年新一代鲁宾AI产品线的推出,我们将见证计算能力的又一次巨大飞跃。


文章标签: #英伟达 #AI芯片 #GPU #推理 #GDDR7

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。