亚马逊通过展示Trainium3服务器配置和下一代Trainium4专用集成电路,加剧了这场定制芯片竞赛,带来了巨大的性能和效率提升。

Cover Image

科技巨头们的定制芯片竞赛确实达到了新的高度,我们看到谷歌Meta以及如今的亚马逊都取得了巨大进展。在AWS re: Invent 2025大会上,亚马逊让客户得以一窥其在专用集成电路领域的未来规划。该公司更重大的进展之一是推出了Trainium3 UltraServers,这本质上是一个可扩展至单个集群包含144颗芯片的人工智能系统。与上一代相比,它带来了“高达4.4倍的计算性能提升、4倍的能效提升以及近4倍的内存带宽提升”。

Trn3 UltraServers将多达144Trainium3芯片集成到一个单一系统中,其计算性能比Trainium2 UltraServers高出多达4.4倍。这使您能够应对先前不切实际或成本过高的AI项目,通过更快地训练模型(将时间从数月缩短至数周)、同时服务更多用户的推理请求,从而减少产品上市时间和运营成本。

Trainium3 UltraServers服务器采用了更新的NeuronSwitch-v1技术,该技术首次亮相便带来了升级的带宽和结构网络。这是亚马逊提供的、用于替代英伟达NVLink方案的解决方案。其理念是将Trainium专用集成电路互连成一个庞大的、包含100万颗芯片的集群,据称能够为推理能力训练“万亿令牌数据集”。鉴于各公司正面临的计算资源限制,UltraServers表明专用集成电路制造商正在积极扩展其计算产品组合。

亚马逊还让我们看到了下一代Trainium4专用集成电路,据说其FP4性能将提高6倍,内存规格也将大幅提升。更重要的是,Trainium4现在也将支持英伟达NVLink技术。这意味着,希望扩展现有基础设施、增加Trainium堆栈并与“绿队”的计算产品组合结合使用的客户,可以轻松实现这一目标。亚马逊报告称,其定制AI芯片获得了巨大的“外部兴趣”,像Anthropic这样的公司报告称训练成本有所降低。

看来,在专用集成电路的竞赛中,亚马逊已经“全力以赴”。继谷歌近期发布TPU之后,这家零售巨头在推进其计算产品组合方面似乎也毫无保留。


文章标签: #亚马逊 #定制芯片 #人工智能 #服务器 #竞赛

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。