人工智能无疑是当前最热门的技术。因此,AMD 在其国际消费电子展主题演讲中,公布其即将推出的面向人工智能的 Helios 机架级解决方案,以及用于人工智能和高性能计算的下一代 Instinct MI400 系列 GPU的相关新信息,也就不足为奇了。此外,该公司正在推出旨在将下一代人工智能和高性能计算加速器与现有数据中心相结合的平台。

Cover Image

HeliosAMD 基于 AMD Zen 6 EPYC “威尼斯” CPU 推出的首个面向高性能计算部署的机架级系统解决方案。它集成了72个Instinct MI455X系列加速器,总计拥有31TB HBM4内存,聚合内存带宽达1.4 PB/s。其目标是为人工智能推理提供高达2.9 exaFLOPS的FP4性能,为人工智能训练提供1.4 exaFLOPS的FP8性能。Helios对功耗和冷却有极高要求,因此需要部署在具有足够支持基础设施的现代人工智能数据中心。

除了 MI455XAMD 更广泛的 Instinct MI400X 系列加速器将采用基于台积电N2(2纳米级别)制造工艺的计算小芯片,这使其成为首批采用该制造技术的GPU。同时,Instinct MI400X 系列将首次根据CDNA 5 架构的不同子集进行差异化划分。

新披露的 MI440XMI455X 将针对低精度工作负载(如 FP4FP8BF16)进行优化。而先前披露的 MI430X 则同时面向主权人工智能和高性能计算,因此它完全支持 FP32FP64 技术计算以及传统的超级计算任务。通过为每种处理器定制特定的精度范围,AMD 可以消除冗余的执行逻辑,从而提高硅片在功耗和成本方面的效率。

MI440XAMD 的全新企业人工智能平台提供动力。该平台并非机架级解决方案,而是一个标准的机架式服务器,配置1个 EPYC “威尼斯” CPU 和8个 MI440X GPU。该公司将该系统定位为一个旨在用于企业人工智能部署的本地部署平台,能够处理训练、微调和推理工作负载,同时在电力和冷却方面与现有数据中心基础设施保持即插即用的兼容性,无需进行任何架构更改。

此外,该公司将提供一个基于 Epyc “威尼斯-X”处理器(具备额外的缓存和更高的单线程性能)和 Instinct MI430X 加速器的主权人工智能及高性能计算平台,该平台能够同时处理低精度人工智能数据和高精度高性能计算工作负载。

预计 Instinct MI430XMI440XMI455X 加速器都将配备 Infinity Fabric以及用于纵向扩展连接的 UALink,这使它们成为首批支持这一新互连技术的加速器。然而,UALink的实际采用将取决于生态系统合作伙伴,例如Astera LabsAuradineEnfabricaXconn

如果这些公司能在 2026年下半年 交付 UALink 交换芯片,那么我们将看到使用 UALink 互连的 Helios设备。如果没有此类交换机,基于 UALink 的系统将不得不使用 UALink-over-Ethernet(这并非 UALink 的设计初衷)或者继续使用传统的网状或环面配置,而不是大规模互连架构。

至于横向扩展连接,AMD 计划为其 Helios 平台提供超以太网支持。与 UALink 不同,超以太网可以依赖现有的网络适配器,例如 AMDPensando Pollara 400G 以及即将推出的Pensando Vulcano 800G网卡,这些网卡能够在已经能够使用最新技术的数据中心中实现高级连接。


文章标签: #AI加速器 #高性能计算 #机架服务器 #Zen6架构 #CES

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。