英伟达鲁宾CPX芯片出人意料地未在GTC大会上亮相,而根据最新消息,该解决方案目前似乎已被“推迟”,并定位于费曼架构。

Cover Image

对于那些不了解情况的读者,自去年第三季度左右ASIC开始受到关注以来,英伟达一直试图通过发布专用解决方案来攻克推理市场,其中一项发布便是鲁宾CPX芯片。这是首批采用GDDR7显存的机架级解决方案之一,其设计目标是针对推理中的预填充工作负载。然而,在今年GTC大会上,当黄仁勋展示鲁宾产品线时,CPX完全不见踪影,暗示该方案可能已被取消或推迟。但英伟达副总裁伊恩·巴克带来了最新消息。

在讨论英伟达的路线图时,巴克透露,鲁宾CPX已被向前推进,但这个想法并未被放弃。相反,我们可能会看到类似的解决方案与费曼架构一同亮相,后者预计将在几年后推出。鉴于工作负载需求已从长上下文转向优先考虑TTFT,目前对于英伟达来说,CPX芯片的构想似乎并不可行。正因如此,配备了GroqLPU单元的鲁宾LPX托盘变得更为重要,因为它专注于推理工作负载的解码阶段。

英伟达一直高度专注于其与Groq合作带来的成果,根据我们观察到的情况,该公司非常热衷于实现令人印象深刻的推理吞吐量。由于LPU采用了SRAM实现,其单个带宽可扩展至150 TB/s,整个机架的纵向扩展带宽高达640 TB/s,这正是英伟达决定坚持使用LPX托盘而非CPX的原因。也有报道称,英伟达正在修订CPX设计,考虑用HBM替代GDDR7,这表明费曼CPX将与我们在鲁宾上看到的方案有所不同。

黄仁勋英伟达为“推理之王”,而Groq解决方案正是该公司渴望保持这一领先地位的方式之一。至于鲁宾CPX的取消,这确实释放了原本会用于AI芯片GDDR7产能,因此对游戏玩家来说也算是个好消息。


文章标签: #英伟达 #AI芯片 #推理 #Groq #路线图

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。