AMD与HPE正在扩大双方长期以来的合作伙伴关系,根据一项新协议,AMD的Helios机架级人工智能架构将从2026年起纳入HPE的产品组合。这使Helios获得了首个主要原始设备制造商的支持,并使HPE能够交付基于下一代Instinct MI455X加速器、新型EPYC“Venice”处理器以及与博通(Broadcom)共同开发的基于以太网的纵向扩展架构构建的完整72-GPU人工智能机架。

自今年早些时候推出以来,Helios一直是AMD开放机架级人工智能平台的参考设计。它采用Meta的Open Rack Wide机械标准,在液冷双宽机箱内集成了MI450系列GPU、Venice CPU以及Pensando网络硬件。
AMD的目标是,在MI455X这一代实现每机架高达2.9 exaFLOPS的FP4计算性能,以及31TB的HBM4内存,并采用一种纵向扩展拓扑结构,使每个GPU都作为单个资源池的一部分暴露出来。HPE将使用一款定制的HPE Juniper交换机来实现该设计,该交换机支持基于以太网的Ultra Accelerator Link。该交换机是与博通合作的成果,构成了系统高带宽GPU互连的骨干。
选择以太网进行纵向扩展连接,旨在将Helios与英伟达(Nvidia)以NVLink为中心的方法区分开来。英伟达的GB200 NVL72机架将36颗Grace CPU和72颗Blackwell GPU保持在一个NVLink域内,并依赖InfiniBand处理系统间流量。而Helios在单一以太网架构下运行着数量相当的GPU,该架构使用UALoE作为加速器链路层。HPE还将采用符合超以太网联盟(Ultra Ethernet Consortium)标准的硬件进行横向扩展网络连接,从而将设计保持在开放、标准驱动的技术栈内。
HPE的采用为Helios在2026年开辟了市场路径,但此次发布也确认了下一代EPYC和Instinct产品将如何进入高性能计算领域。斯图加特高性能计算中心已选择HPE的Cray GX5000平台作为其下一代旗舰系统,该系统名为Herder。它将在一组直接液冷刀片上使用MI430X GPU和Venice CPU。
Herder系统计划于2027年下半年交付,并将取代HLRS当前的Hunter系统。HPE强调了该项目能源策略的环保性,该策略利用GX5000机架的废热为斯图加特大学菲英根校区的建筑供暖。
AMD和HPE计划明年在全球范围内提供基于Helios的系统,这为该架构提供了首个商业部署路径,并对已经投入服务的机架级Blackwell平台形成了制衡。



