僵尸生存游戏《消逝的光芒》免费大更新26日上线,手动精修堪比重制
阅读全文

锤刻创思寰宇网
AMD近日进一步披露了基于RDNA 4架构的Radeon AI PRO R9700显卡细节,重点展示了其在AI运算性能上相较现有Radeon PRO W7800的显著提升。这款定位专业AI加速领域的新品将为用户带来4倍AI算力(TOPS)与2倍性能飞跃。
在推出ROCm 7软件套件的同时,AMD明确了三层次AI加速战略:面向中小型语言模型的Ryzen AI MAX APU、专注多GPU边缘推理的Radeon AI PRO GPU系列,以及针对数据中心级大模型训练/推理的Instinct加速器。继MI350系列之后,官方首次公布了Radeon AI PRO产品线的AI性能参数。
Radeon AI PRO R9700搭载Navi 48核心,集成64个计算单元(4096个流处理器)和128个AI加速器,整卡功耗300W。其配备32GB GDDR6显存(256位总线),显存容量是上代9070 XT的两倍。性能参数方面,FP16计算能力达96万亿次,INT4稀疏计算高达1531 TOPS。
这款显卡专为高效处理高质量AI模型而设计,32GB显存容量可完美支持当前主流大模型运算,包括DeepSeek R1 Distill Qwen 32B Q6、Mistral Small 3.1 24B等复杂工作负载。性能测试显示,在DeepSeek R1任务中,R9700速度达到W7800的两倍;对比16GB显存的RTX 5080时,某些场景下甚至能实现5倍性能优势。
具体算力表现上,该卡提供47.8 TFLOPS FP32、191.4 TFLOPS FP16/BF16、382.7 TFLOPS FP8计算能力,INT8/INT4算力分别为382.7/765.5 TOPS。支持Wave矩阵乘加指令(WMMA)与结构化稀疏技术,在稀疏运算下INT4算力可跃升至1531 TOPS。相较W7800,其FP16性能翻倍,INT8/INT4性能提升达4倍。
AMD特别强调大模型支持对结果质量的关键影响:在文生图任务中,FP16精度的80亿参数模型效果远超10亿参数模型;而推理任务中,320亿参数6-bit模型的准确率也显著优于80亿参数同精度模型。单卡对比测试显示,R9700在DeepSeek R1 Distill Llama(8B)任务中的FP16性能较W7800提升超2倍。
更令人瞩目的是,通过PCIe 5.0平台组建4卡系统时,R9700可形成128GB显存池,轻松驾驭Mistral 123B、DeepSeek R1 70B等消耗112-116GB显存的大型模型。
产品规格方面,R9700采用双槽涡轮散热设计,计划于今年7月通过华硕(ASUS)、华擎(ASRock)、技嘉(Gigabyte)、蓝宝石(Sapphire)等合作伙伴上市。