亚马逊首席执行官安迪·贾西就公司的定制芯片业务向股东致信,其言辞显示出对内部基础设施堆栈的强烈乐观。

毫无疑问,超大规模云服务商正经历着我们所谓的“算力紧缩”,当前的基础设施无法满足由AI及相关服务驱动的需求。我们已经看到像亚马逊、谷歌和Meta这样的巨头诉诸于定制芯片,以弥补算力缺口。但在其中,亚马逊的Trainium芯片和Graviton服务器CPU已被证明是成熟的解决方案,这也是为什么首席执行官安迪·贾西对它们表现出巨大信心。在与股东交流时,贾西表示,他们的定制芯片业务正在扩大规模,以实现500亿美元的年度经常性收入,这一数字惊人地高于AMD和英特尔所达到的水平。
拥有我们自己备受追捧的AI芯片开辟了许多可能性,但或许最大的莫过于能够为客户降低成本,并为AWS确保更好的经济效益。在大规模应用下,我们预计Trainium每年将为我们节省数百亿美元的资本支出,与依赖他人的芯片进行推理相比,将提供数百个基点的运营利润率优势。
这500亿美元的年度经常性收入数字,是对亚马逊定制芯片业务如果分拆成为像英伟达那样的独立计算提供商所能达到规模的预估。Trainium和Graviton的增长主要来自AWS的云服务,亚马逊尚未向需要计算能力的其他客户提供其定制芯片。贾西表示,AWS和ASIC选项带来的经济效益优于英伟达。虽然他重申了对英伟达的承诺,但他补充说,客户需要一个在“性价比”上占主导地位的选择,他相信Trainium在这方面表现要好得多。
亚马逊首席执行官还暗讽了英特尔及其CPU市场份额,称基于ARM的Graviton芯片推出后,AWS的基础设施现已由其主导。贾西表示,在训练和推理方面,Trainium正在上演类似的情况。他的陈述中有一个有趣的观点,可能是业界尚未意识到的。定制基础设施的理念并非要取代主流的计算选项,例如来自英伟达的那些,而是要解决算力缺口,这个缺口如此之大,以至于像亚马逊这样的超大规模云服务商无法完全依赖GPU制造商。
有趣的是,亚马逊还暗示可能将其服务器机架出售给第三方客户,这表明它很可能直接与英伟达等公司竞争。在公司计划向该业务投入“数千亿美元”资本支出的支持下,Trainium + Graviton堆栈未来的发展将非常值得关注。



