AMD已开始在GitHub平台提交ROCm 7软件堆栈的发布标签,预计将在未来几周内正式推出。这款被寄予厚望的软件生态旨在打破英伟达(NVIDIA)CUDA的垄断格局。

Cover Image

作为英伟达主导人工智能行业的关键优势,CUDA软件生态已成为AI开发者的首选工具。由于其专属于英伟达原生硬件,使得超威半导体(AMD)等竞争对手难以突围。在近期举办的“Advancing AI”活动上,AMD宣布推出新一代ROCm 7.0软件堆栈,通过增强框架和新算法打造可替代英伟达CUDA的计算生态系统。

根据技术媒体Phoronix报道,AMD已在GitHub平台为ROCm 7.0创建发布标签,包括ROCm/hip中的rocm-7.0.0和ROCm/aomp中的rocm-7.0.0版本。HIP、AOMP和ROCm库均已完成7.0.0标签的提交,这标志着正式发布已进入倒计时阶段。

在此前的技术发布会上,AMD透露ROCm 7的最大升级重点在于推理工作负载优化。相比ROCm 6,新一代平台在AI工作负载中可实现最高3.5倍的性能提升。更引人注目的是,Instinct MI355X加速器在DeepSeek R1测试中展现出比英伟达Blackwell B200更快的训练性能,FP8吞吐量性能高出30%

主要升级特性包括:

  • 最新算法与模型支持

  • 扩展AI规模的先进功能

  • MI350系列加速器支持

  • 集群管理功能

  • 企业级能力增强

虽然目前尚未公布具体发布日期,但根据开发进度推测,ROCm 7软件堆栈预计将在未来数周内亮相,具体时间取决于AMD如何将其与AI硬件产品进行协同发布。


文章标签: #AMD #ROCm7 #英伟达 #CUDA #AI生态

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。