虽然AI GPU巨头英伟达(NVIDIA)的芯片被广泛认为相比定制AI芯片替代方案具有更优的总拥有成本(TCO),但Evercore ISI的分析师认为,AI工程师对这些芯片并不感冒。英伟达首席执行官黄仁勋(Jensen Huang)多次为其公司的AI芯片定价辩护,声称其比竞争对手提供更好的性能效率。然而,根据Evercore的报告,AI工程师在决定使用哪些产品时,也会关注其他指标,例如芯片冷却成本。

GDOH4382-scaled-1.jpeg

Evercore关于使用英伟达AI芯片成本的讨论,紧随摩根士丹利(Morgan Stanley)的一份报告之后。摩根士丹利在报告中称,尽管使用英伟达的Blackwell GPU构建数据中心的成本是定制AI芯片的两倍,但Blackwell GPU的每瓦性能却高出八倍。

然而,Evercore在其报告中指出,AI工程师在评估AI芯片时,关注的因素不仅仅是每瓦性能。这家金融机构援引AI工程师及其他超大规模数据中心业内人士的话称,芯片用户在使用英伟达芯片时也在考虑其他因素。

英伟达的一张幻灯片展示了一系列硬件架构,包括BlackwellRubinFeynman,并展示了2024年2026年2028年的各种NVLink型号和CPU。

据Evercore称,从“训练主导模式”向“推理主导模式”的转变,“使得人们更加关注每个词元的成本、投资回报率和总拥有成本,这加速了超大规模数据中心对自研ASIC和替代加速器的兴趣。”这一说法也得到了AI计算基础设施提供商Nebius的一位专家的印证。该专家指出,GPU正通过每生成百万个词元的成本等指标进行评估。

该金融机构还指出,向推理的转变正在将“购买标准从最大吞吐量/带宽转向每个词元的成本、功耗、冷却、利用率、总拥有成本。”它补充说,英伟达“声称的35倍提升并未引起普通AI工程师的共鸣,因为人们认为70%的毛利率过高。”因此,Evercore指出,普通工程师“愿意使用ASIC或‘足够好’的替代方案来改善经济效益。”

Nebius专家指出,推理需求占企业工作负载用例总数的95%。据该专家称,Groq芯片也因其更高的吞吐量而受到青睐。


文章标签: #AI芯片 #英伟达 #数据中心 #ASIC #GPU

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。