AMDHPE正在扩大双方长期以来的合作伙伴关系,根据一项新协议,AMDHelios机架级人工智能架构将从2026年起纳入HPE的产品组合。这使Helios获得了首个主要原始设备制造商的支持,并使HPE能够交付基于下一代Instinct MI455X加速器、新型EPYC“Venice”处理器以及与博通(Broadcom)共同开发的基于以太网的纵向扩展架构构建的完整72-GPU人工智能机架。

Cover Image

自今年早些时候推出以来,Helios一直是AMD开放机架级人工智能平台的参考设计。它采用MetaOpen Rack Wide机械标准,在液冷双宽机箱内集成了MI450系列GPUVenice CPU以及Pensando网络硬件。

AMD的目标是,在MI455X这一代实现每机架高达2.9 exaFLOPSFP4计算性能,以及31TBHBM4内存,并采用一种纵向扩展拓扑结构,使每个GPU都作为单个资源池的一部分暴露出来。HPE将使用一款定制的HPE Juniper交换机来实现该设计,该交换机支持基于以太网的Ultra Accelerator Link。该交换机是与博通合作的成果,构成了系统高带宽GPU互连的骨干。

选择以太网进行纵向扩展连接,旨在将Helios英伟达(Nvidia)NVLink为中心的方法区分开来。英伟达GB200 NVL72机架将36Grace CPU72Blackwell GPU保持在一个NVLink域内,并依赖InfiniBand处理系统间流量。而Helios在单一以太网架构下运行着数量相当的GPU,该架构使用UALoE作为加速器链路层。HPE还将采用符合超以太网联盟(Ultra Ethernet Consortium)标准的硬件进行横向扩展网络连接,从而将设计保持在开放、标准驱动的技术栈内。

HPE的采用为Helios2026年开辟了市场路径,但此次发布也确认了下一代EPYCInstinct产品将如何进入高性能计算领域。斯图加特高性能计算中心已选择HPECray GX5000平台作为其下一代旗舰系统,该系统名为Herder。它将在一组直接液冷刀片上使用MI430X GPUVenice CPU

Herder系统计划于2027年下半年交付,并将取代HLRS当前的Hunter系统。HPE强调了该项目能源策略的环保性,该策略利用GX5000机架的废热为斯图加特大学菲英根校区的建筑供暖。

AMDHPE计划明年在全球范围内提供基于Helios的系统,这为该架构提供了首个商业部署路径,并对已经投入服务的机架级Blackwell平台形成了制衡。


文章标签: #人工智能 #高性能计算 #AMD #HPE #服务器架构

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。