AMD发布了全新的Instinct MI350P PCIe GPU加速器,这是多年来首款面向AI工作负载的PCIe设计。Instinct MI350P PCIe GPU采用MI350X芯片,砍掉一半后配备128个计算单元、144 GB HBM3E显存,功耗为600瓦。

借助这款产品,AMD为企业用户提供了扩展AI计算能力的选项,无需投资昂贵的基础设施。MI350P的PCIe设计使其成为易于使用的即插即用解决方案,能在标准双槽服务器中带来强劲性能。
为了帮助您为智能体AI时代做好准备,AMD Instinct MI350P PCIe是一款双槽即插即用卡,适用于标准风冷服务器。它专为在现有数据中心电力、冷却和机架基础设施中部署本地推理而设计。这款高性价比的PCIe卡完善了AMD AI计算产品组合,为企业在独特AI应用过程中提供多种选择。
以下是Instinct MI350P PCIe GPU的亮点:
原生支持低精度MXFP6和MXFP4,可提供高吞吐量
通过稀疏性支持主流8位和16位精度加速
估计2,299 TFLOPS(TFLOPS),MXFP4下最高可达4,600 TFLOPS峰值,是目前企业PCIe卡中性能最高的
估计144 GB高带宽内存3e(HBM3E),带宽高达4 TB/s
开放生态系统,提供低成本和零成本开发栈选项,简化部署并帮助降低运营成本
从规格来看,AMD Instinct MI350P采用CDNA 4架构(CDNA 4),基于台积电3纳米(TSMC 3nm)制程技术,配置4个XCD,是MI350X的一半。它还配备一个IO die,基于台积电6纳米FinFET(TSMC 6nm FinFET)工艺。芯片拥有128个计算单元,相当于8,192个流处理器和512个矩阵核心,核心峰值频率为2200 MHz,整个芯片包含730亿个晶体管。
内存方面,Instinct MI350P配备128 MB无限缓存(Infinity Cache)作为LLC,以及144 GB快速HBM3E内存,通过4096位总线运行,提供4 TB/s带宽。相比之下,MI350X配备288 GB HBM3E内存,总线接口为8192位。PCIe卡长度为10.5英寸(267毫米),采用被动散热设计,适合服务器。AMD还使用16针连接器以满足600瓦TBP,也可配置为450瓦。
在性能方面,AMD Instinct MI350P提供:
4.6 PFLOPs MXFP4
4.6 PFLOPs MXFP6
2.3 PFLOPs MXFP8
2.3 PFLOPs FP16(稀疏性)
1.15 PFLOPs FP16
72 TFLOPs FP16
72 TFLOPs FP32
36 TFLOPs FP64
2.3 POPs INT8
4.6 POPs INT8(稀疏性)
1.15 PFLOPs BFloat16
2.30 PFLOPs BFloat16(稀疏性)
由此可见,AMD Instinct MI350系列(包括MI350P)原生加速了MXFP6和MXFP4等多种企业AI精度格式。
MI350P将与H200 NVL竞争,后者是英伟达(NVIDIA)上一款基于PCIe的GPU加速器,配备141 GB HBM3E内存,搭载Hopper H200 GPU。英伟达(NVIDIA)已推出RTX PRO 6000 Blackwell服务器版,但其基于标准GB202芯片,而非真正的服务器选项GB200。RTX PRO 6000 Blackwell配备96 GB GDDR7内存。H200 NVL GPU的售价约为30,000到40,000美元。
AMD Instinct MI350P PCIe GPU现已通过各大合作伙伴提供,拥有完全开放的生态系统,并支持ROCm企业级AI软件栈。



