AMD低调发布锐龙5500X3D,老款3D缓存芯片降频版
阅读全文

锤刻创思寰宇网
本周,AMD(超威半导体)发布了第七代ROCm(Radeon开放式计算)开源加速计算软件堆栈。相比ROCm 6,新版本显著提升了现有硬件在AI推理任务中的性能表现,新增分布式工作负载支持,并首次扩展至Windows系统和Radeon显卡平台。值得一提的是,ROCm 7还为最新Instinct MI350X/MI355X处理器增添了FP4与FP6低精度格式支持。
对于消费级PC而言,ROCm 7最重大的变革在于实现Windows系统与Radeon显卡的兼容。这使得基于锐龙平台的PC能够利用独立或集成显卡执行AI工作负载。自2025年下半年起,开发者将可在配备Radeon显卡的锐龙台式机或笔记本上构建并运行AI程序,这对需要本地部署高端AI大语言模型的用户具有重大意义。
AMD在AI硬件市场的弱势地位部分源于软件生态不足,但情况正在改善——据官方数据显示,采用ROCm 7的Instinct MI300X相较ROCm 6实现了3.5倍推理性能提升与3倍训练吞吐量增长。测试基于八路MI300X系统运行Llama 3.1-70B、Qwen 72B和Deepseek-R1模型,批次规模1-256不等,唯一变量为ROCm版本。AMD表示这些提升源于GPU利用率与数据调度的优化,但未透露具体技术细节。
新版本还通过集成vLLM、SGLang和llm-d等开源框架,首次支持分布式推理。AMD与合作伙伴共同开发了共享组件与基础模块,使软件能高效扩展至多GPU环境。此外,FP4与FP6低精度数据类型的支持将为基于CDNA 4架构的MI350X/MI355X,以及2026-2027年相继推出的CDNA 5架构MI400X与下一代MI500X系列带来实质性能提升。
同步推出的ROCm Enterprise AI MLOps企业级解决方案提供领域数据集模型优化工具,支持结构化或非结构化工作流集成。AMD正与生态伙伴合作为聊天机器人、文档摘要等应用构建参考方案,加速生产环境部署。最后亮相的开发者云服务提供即用型MI300X硬件资源,配置从单卡192GB到八卡1536GB内存不等,新用户可获25免费使用时长,后续可通过开发者计划获取额度。基于MI350X系统的早期支持也已在规划中。