AI工程师对英伟达芯片不感冒，冷却与功耗成本推动超大规模数据中心转向定制ASIC

虽然AI GPU巨头英伟达（NVIDIA）的芯片被广泛认为相比定制AI芯片替代方案具有更优的总拥有成本（TCO），但Evercore ISI的分析师认为，AI工程师对这些芯片并不感冒。英伟达首席执行官黄仁勋（Jensen Huang）多次为其公司的AI芯片定价辩护，声称其比竞争对手提供更好的性能效率。然而，根据Evercore的报告，AI工程师在决定使用哪些产品时，也会关注其他指标，例如芯片冷却成本。

Evercore关于使用英伟达AI芯片成本的讨论，紧随摩根士丹利（Morgan Stanley）的一份报告之后。摩根士丹利在报告中称，尽管使用英伟达的Blackwell GPU构建数据中心的成本是定制AI芯片的两倍，但Blackwell GPU的每瓦性能却高出八倍。

然而，Evercore在其报告中指出，AI工程师在评估AI芯片时，关注的因素不仅仅是每瓦性能。这家金融机构援引AI工程师及其他超大规模数据中心业内人士的话称，芯片用户在使用英伟达芯片时也在考虑其他因素。

英伟达的一张幻灯片展示了一系列硬件架构，包括Blackwell、Rubin和Feynman，并展示了2024年、2026年和2028年的各种NVLink型号和CPU。

据Evercore称，从“训练主导模式”向“推理主导模式”的转变，“使得人们更加关注每个词元的成本、投资回报率和总拥有成本，这加速了超大规模数据中心对自研ASIC和替代加速器的兴趣。”这一说法也得到了AI计算基础设施提供商Nebius的一位专家的印证。该专家指出，GPU正通过每生成百万个词元的成本等指标进行评估。

该金融机构还指出，向推理的转变正在将“购买标准从最大吞吐量/带宽转向每个词元的成本、功耗、冷却、利用率、总拥有成本。”它补充说，英伟达“声称的35倍提升并未引起普通AI工程师的共鸣，因为人们认为70%的毛利率过高。”因此，Evercore指出，普通工程师“愿意使用ASIC或‘足够好’的替代方案来改善经济效益。”

Nebius专家指出，推理需求占企业工作负载用例总数的95%。据该专家称，Groq芯片也因其更高的吞吐量而受到青睐。

搜索结果如下

阅读全文

AI工程师对英伟达芯片不感冒，冷却与功耗成本推动超大规模数据中心转向定制ASIC

也可以看看

《降世神通》改编格斗游戏，7月23日发售

阅读全文

《忘掉莎拉·马歇尔2》有望推出，杰森·席格尔透露续集计划

阅读全文

《哈利·波特》剧版大改，戈德里克山谷换新址，起源故事更震撼

阅读全文