AMD正式发布了新一代Instinct MI350系列加速器,包含MI350X与旗舰款MI355X两款型号,晶体管数量高达1850亿颗。这款基于台积电3纳米制程的全新CDNA 4架构GPU,将AI计算性能推升至20 PFLOPS(FP4/FP6),并支持最新FP6/FP4数据格式。

Cover Image

该系列芯片提供风冷与液冷两种配置方案,采用8组计算单元分区设计(每区含32个计算单元),总计16,384个核心。虽然核心数量较前代MI300系列的19,456个有所精简,但通过架构优化实现了4倍的代际性能提升。其HBM3e显存容量高达288GB(8组36GB堆栈),配备256MB无限缓存,内存带宽达8TB/s

性能参数方面:

  • 旗舰款MI355X(1400W TDP)提供:

  • 79 TFLOPS FP64精度

  • 5 PFLOPS FP16精度

  • 20 PFLOPS FP6/FP4精度

  • 完整8卡系统可实现:

  • 2.3TB HBM3e显存

  • 64TB/s总带宽

  • 161 PFLOPS FP6/FP4算力

对比测试数据显示:

  1. 相较竞品英伟达B200:
  • 显存容量提升1.6倍

  • FP6精度性能领先2.2倍

  1. 相较前代MI300X:
  • Llama 3.1 405B模型推理吞吐量实现35倍跃升

  • 主流AI负载性能提升2.8-4.2倍

生态系统方面:

  • 单液冷机架可部署128-96张MI350加速卡

  • 搭配Zen5架构“都灵”EPYC处理器

  • 集成Pollara 400互联方案

  • 总算力达2.6 EFLOPS(FP4)

实际应用表现:

  • 在Llama 3.1 405B(FP4模式)测试中,MI355X性能与英伟达Blackwell GB200服务器相当

  • 相较B200方案,令牌生成效率提升40%

该系列预计2025年第三季度通过合作伙伴上市,而采用CDNA Next架构的MI400系列已进入研发阶段,计划2026年发布。


文章标签: #AMD #AI加速器 #3纳米 #HBM3e #性能对比

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。