AMD发布Radeon AI PRO R9700显卡，AI算力提升4倍，性能翻番

AMD近日进一步披露了基于RDNA 4架构的Radeon AI PRO R9700显卡细节，重点展示了其在AI运算性能上相较现有Radeon PRO W7800的显著提升。这款定位专业AI加速领域的新品将为用户带来4倍AI算力（TOPS）与2倍性能飞跃。

Cover Image

在推出ROCm 7软件套件的同时，AMD明确了三层次AI加速战略：面向中小型语言模型的Ryzen AI MAX APU、专注多GPU边缘推理的Radeon AI PRO GPU系列，以及针对数据中心级大模型训练/推理的Instinct加速器。继MI350系列之后，官方首次公布了Radeon AI PRO产品线的AI性能参数。

Radeon AI PRO R9700搭载Navi 48核心，集成64个计算单元（4096个流处理器）和128个AI加速器，整卡功耗300W。其配备32GB GDDR6显存（256位总线），显存容量是上代9070 XT的两倍。性能参数方面，FP16计算能力达96万亿次，INT4稀疏计算高达1531 TOPS。

这款显卡专为高效处理高质量AI模型而设计，32GB显存容量可完美支持当前主流大模型运算，包括DeepSeek R1 Distill Qwen 32B Q6、Mistral Small 3.1 24B等复杂工作负载。性能测试显示，在DeepSeek R1任务中，R9700速度达到W7800的两倍；对比16GB显存的RTX 5080时，某些场景下甚至能实现5倍性能优势。

具体算力表现上，该卡提供47.8 TFLOPS FP32、191.4 TFLOPS FP16/BF16、382.7 TFLOPS FP8计算能力，INT8/INT4算力分别为382.7/765.5 TOPS。支持Wave矩阵乘加指令（WMMA）与结构化稀疏技术，在稀疏运算下INT4算力可跃升至1531 TOPS。相较W7800，其FP16性能翻倍，INT8/INT4性能提升达4倍。

AMD特别强调大模型支持对结果质量的关键影响：在文生图任务中，FP16精度的80亿参数模型效果远超10亿参数模型；而推理任务中，320亿参数6-bit模型的准确率也显著优于80亿参数同精度模型。单卡对比测试显示，R9700在DeepSeek R1 Distill Llama（8B）任务中的FP16性能较W7800提升超2倍。

更令人瞩目的是，通过PCIe 5.0平台组建4卡系统时，R9700可形成128GB显存池，轻松驾驭Mistral 123B、DeepSeek R1 70B等消耗112-116GB显存的大型模型。

产品规格方面，R9700采用双槽涡轮散热设计，计划于今年7月通过华硕（ASUS）、华擎（ASRock）、技嘉（Gigabyte）、蓝宝石（Sapphire）等合作伙伴上市。

搜索结果如下

阅读全文

AMD发布Radeon AI PRO R9700显卡，AI算力提升4倍，性能翻番

也可以看看

iPhone 18系列灵动岛或将缩小，外观迎来微调

阅读全文

乐高漫威神盾局天空母舰，完美MCU收藏品，售价400美元

阅读全文

《蜘蛛侠：全新一天》暗示漫威最被低估反派组织手合会将获重大救赎

阅读全文