投资银行摩根士丹利(Morgan Stanley)认为,虽然使用英伟达(NVIDIA)的Blackwell GPU建设数据中心的成本是使用AI专用集成电路(ASIC)的两倍,但英伟达芯片的计算效率也显著高于定制芯片。英伟达最新AI GPU的高成本是市场热议话题,其首席执行官黄仁勋(Jensen Huang)多次声称,尽管他的芯片价格昂贵,但从长远来看能带来更高的回报。

摩根士丹利称英伟达每瓦计算性能领先定制AI芯片高达8倍
在最新报道中,摩根士丹利比较了英伟达不同AI GPU与亚马逊(Amazon)和谷歌(Google)提供的定制AI ASIC在每瓦TFLOPS(万亿次浮点运算/秒)性能上的表现。该机构评论称,超大规模云服务商使用英伟达Blackwell AI GPU建设1吉瓦数据中心的资本支出,是使用谷歌张量处理单元(TPU)或亚马逊Trainium芯片建设同等数据中心的两倍。
不过,该机构补充称,投资英伟达芯片是值得的,因为它们提供了更高的计算效率。根据摩根士丹利的估算,英伟达芯片的每瓦性能“领先定制ASIC 2到8倍”。
英伟达的一张幻灯片展示了标注为Blackwell、Rubin和Feynman的一系列硬件架构,以及2024年、2026年和2028年的各种NVLink型号和CPU。
摩根士丹利称英伟达Rubin芯片显著超越亚马逊与谷歌的定制AI芯片
该投资银行报告中附带的幻灯片计算了英伟达Vera Rubin(FP4)、Vera Rubin(FP8)、GB300(FP8)和H100(FP8) AI GPU的每瓦TFLOPS性能。自然,Vera Rubin(FP4)以19.5的得分位列榜单最高。其他芯片的得分分别为6.8、6.0和3.1。另一方面,谷歌TPUv7(FP8)和Trn3(FP8)芯片的每瓦TFLOPS分别为4.3和2.5,其性能介于Blackwell和Hopper代GPU之间,或低于Hopper芯片。
虽然英伟达芯片提供了最高的每瓦性能,但用户也开始关注其他指标。例如,据AI基础设施提供商Nebius的一位专家称,AI芯片也通过其每小时运行成本生成每百万词元(token)的成本来评估。Nebius的估算显示,Groq的AI芯片每个词元成本在5到10美分之间,而英伟达Blackwell芯片每个词元成本为25美分。据称,Groq芯片还能提供高达每秒800个词元的处理速度,远高于英伟达芯片的每秒450个词元。



