英伟达(NVIDIA)已开始向主要AI公司出货首批Vera CPU,标志着该产品正式进入全面生产阶段,以加速代理式AI的发展。Vera CPU专为代理式AI打造,现已全面投产,公司已将首批芯片交付给多家AI公司。Vera CPU是英伟达代理式AI生态的下一个篇章,为其下一个数十亿美元的市场奠定基石。

NVIDIA-Vera-CPU-2-scaled.jpeg

今天,英伟达超大规模与高性能计算副总裁伊恩·巴克(Ian Buck)亲手将首批Vera CPU交付给四家正在加速代理式AI发展的大型AI公司,包括OpenAISpaceXAnthropic甲骨文云(Oracle Cloud)。这标志着Vera CPU首次离开英伟达实验室,落入首批客户手中。

伊恩·巴克分享了他的交付之旅。首批Vera CPU抵达了Anthropic位于旧金山SoMa的办公室。下一站是OpenAI的Mission Bay总部,第二个搭载Vera CPU的机架在此交付。最后是SpaceXAI埃隆·马斯克(Elon Musk)本人在帕洛阿尔托办公室接收了Vera。

所有三个Vera机架均在周五交付。周一,伊恩·巴克访问了甲骨文(Oracle)的AI客户卓越中心,交付了最后一个Vera CPU机架。

这些交付只是英伟达未来几个季度出货量的冰山一角。代理式AI公司目前对CPU表现出巨大兴趣,专为此打造的Vera正获得疯狂关注。就在上周,我们报道了Vera CPU将被CoreWeaveMeta阿里巴巴(Alibaba)作为早期买家采用。甲骨文也曾被提及,正如你所见,它们已经收到了首批芯片。

Vera CPU——Grace的继任者,有何期待?

英伟达称,Vera CPU提供极高的单线程核心性能、极高的数据输出以及极致的能效。Vera是全球首款也是唯一一款采用LPDDR5内存的数据中心CPU,提供无与伦比的每瓦性能。英伟达不仅将Vera CPU集成到其Vera Rubin平台,还将单独出货,公司预计这将为其开辟另一个数十亿美元的业务领域。

针对Vera CPU,英伟达设计了代号为奥林巴斯(Olympus)的下一代定制Arm架构。该芯片包含88个核心176个线程(采用英伟达空间多线程(Spatial Multi-Threading)技术)、1.8 TB/sNVLink-C2C一致性内存互连、1.5 TB系统内存(是Grace3倍)、通过SOCAMM LPDDR5X实现的1.2 TB/s内存带宽,以及机架级机密计算。这些结合使其数据处理、压缩和CI/CD性能达到Grace的2倍

随着Vera的推出,对LPDDR5X DRAM的需求也将激增,因为该平台支持高达1.5 TB的内存。考虑到满足计算需求所需的Vera CPU数量,供应链将面临更大的压力。英伟达Vera Rubin平台计划于2026年5月本周后半段发布,首批机架的量产即将开始。Vera将同时用于独立LPX服务器和Vera Rubin NVL72机架中的主处理器。

随着Vera现已进入全面生产阶段,Rubin也将在未来几个月内发布,英伟达推出的极致协同设计平台将把代理式AI工作流推向新高度。


文章标签: #AI芯片 #数据中心 #自研架构 #英伟达 #代理式AI

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。