AMD发布了全新的Instinct MI350P PCIe GPU加速器,这是多年来首款面向AI工作负载的PCIe设计。Instinct MI350P PCIe GPU采用MI350X芯片,砍掉一半后配备128个计算单元、144 GB HBM3E显存,功耗为600瓦。

AMD-Instinct-MI350P-GPU-Accelerator.jpeg

借助这款产品,AMD为企业用户提供了扩展AI计算能力的选项,无需投资昂贵的基础设施。MI350P的PCIe设计使其成为易于使用的即插即用解决方案,能在标准双槽服务器中带来强劲性能。

为了帮助您为智能体AI时代做好准备,AMD Instinct MI350P PCIe是一款双槽即插即用卡,适用于标准风冷服务器。它专为在现有数据中心电力、冷却和机架基础设施中部署本地推理而设计。这款高性价比的PCIe卡完善了AMD AI计算产品组合,为企业在独特AI应用过程中提供多种选择。

以下是Instinct MI350P PCIe GPU的亮点:

  • 原生支持低精度MXFP6和MXFP4,可提供高吞吐量

  • 通过稀疏性支持主流8位和16位精度加速

  • 估计2,299 TFLOPS(TFLOPS),MXFP4下最高可达4,600 TFLOPS峰值,是目前企业PCIe卡中性能最高的

  • 估计144 GB高带宽内存3e(HBM3E),带宽高达4 TB/s

  • 开放生态系统,提供低成本和零成本开发栈选项,简化部署并帮助降低运营成本

从规格来看,AMD Instinct MI350P采用CDNA 4架构(CDNA 4),基于台积电3纳米(TSMC 3nm)制程技术,配置4个XCD,是MI350X的一半。它还配备一个IO die,基于台积电6纳米FinFET(TSMC 6nm FinFET)工艺。芯片拥有128个计算单元,相当于8,192个流处理器和512个矩阵核心,核心峰值频率为2200 MHz,整个芯片包含730亿个晶体管。

内存方面,Instinct MI350P配备128 MB无限缓存(Infinity Cache)作为LLC,以及144 GB快速HBM3E内存,通过4096位总线运行,提供4 TB/s带宽。相比之下,MI350X配备288 GB HBM3E内存,总线接口为8192位。PCIe卡长度为10.5英寸(267毫米),采用被动散热设计,适合服务器。AMD还使用16针连接器以满足600瓦TBP,也可配置为450瓦。

在性能方面,AMD Instinct MI350P提供:

  • 4.6 PFLOPs MXFP4

  • 4.6 PFLOPs MXFP6

  • 2.3 PFLOPs MXFP8

  • 2.3 PFLOPs FP16(稀疏性)

  • 1.15 PFLOPs FP16

  • 72 TFLOPs FP16

  • 72 TFLOPs FP32

  • 36 TFLOPs FP64

  • 2.3 POPs INT8

  • 4.6 POPs INT8(稀疏性)

  • 1.15 PFLOPs BFloat16

  • 2.30 PFLOPs BFloat16(稀疏性)

由此可见,AMD Instinct MI350系列(包括MI350P)原生加速了MXFP6和MXFP4等多种企业AI精度格式。

MI350P将与H200 NVL竞争,后者是英伟达(NVIDIA)上一款基于PCIe的GPU加速器,配备141 GB HBM3E内存,搭载Hopper H200 GPU英伟达(NVIDIA)已推出RTX PRO 6000 Blackwell服务器版,但其基于标准GB202芯片,而非真正的服务器选项GB200RTX PRO 6000 Blackwell配备96 GB GDDR7内存。H200 NVL GPU的售价约为30,000到40,000美元

AMD Instinct MI350P PCIe GPU现已通过各大合作伙伴提供,拥有完全开放的生态系统,并支持ROCm企业级AI软件栈。


文章标签: #AMD #AI加速器 #CDNA #PCIe #HBME

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。