据SemiAnalysis报道,AMD计划于2026年推出首批两款机架级Instinct加速器,以对标英伟达(Nvidia)的VR300 NVL144。这两款产品命名为AMD Instinct MI450X IF64Instinct MI450X IF128,均专为人工智能部署设计。若取得成功,或将逐步改变AI硬件市场格局。

Cover Image

尽管AMD Instinct MI300系列AI与高性能计算GPU在参数上表现强劲,但其最大扩展规模仅支持八处理器配置,在性能可扩展性方面难以匹敌英伟达GB200 NVL72机架级解决方案。不过这一局面将在明年迎来转变——AMD拟推出配备64和128个GPU封装的Instinct MI450X IF64与IF128解决方案,直接竞争英伟达VR200 NVL144(含72个GPU封装)。

理论上,AMD MI450X IF128可能优于英伟达VR200 NVL144。但其复杂性和技术挑战可能影响初期表现。MI450X IF128将成为AMD首个支持跨双机架多AI处理器的系统,通过基于以太网扩展的Infinity Fabric实现互联。该方案采用16台1U服务器,每台搭载一颗AMD EPYC“Venice”处理器和四块配备独立LPDDR内存池及PCIe x4固态硬盘的Instinct MI450X GPU。128块GPU间单向内部带宽超1.8TB/s,可构建比现有方案更庞大的计算集群。

对于跨机组的横向扩展通信,系统将为每块GPU配置最多三张800GbE Pensando网卡,实现单设备2.4Tb/s总出口带宽(通过PCIe)。次级配置允许每GPU使用两张800GbE网卡,但由于PCIe 5.0链路带宽限制,无法充分发挥接口性能。

与英伟达GB200系列采用嵌入式有源光缆连接机架的方案不同,AMD将采用更简单的被动铜缆布线。这种策略有助于降低系统成本和功耗,但可能受信号完整性或线缆长度限制。

考虑到系统复杂性可能导致的制造与部署延迟,AMD同步开发了简化版架构MI450X IF64。该变体限于单机架部署,采用精简互连设计,有望实现更可控的推广进程。

若成功实施该架构,AMD或能提升在AI计算市场(特别是AI推理系统)的竞争力。但能否撼动英伟达主导地位仍有待观察。


文章标签: #AMD #英伟达 #AI加速器 #机架级 #GPU

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。