昨天有消息传出,AMD的RDNA 4显卡在发布初期将不会支持ROCm。这对于那些计划升级设备并期待无缝过渡的开发者来说,无疑是个令人失望的消息。不过,ROCm的支持可能并不会太晚到来。AMD人工智能软件副总裁似乎暗示,一款来自RX 9070系列的显卡已经在专用的ROCm环境中成功运行。

Cover Image

ROCm是一个开源的GPU编程软件栈,它让显卡的用途不再局限于图形渲染,而是可以用于高性能计算(HPC)和人工智能应用。这包括专业的Instinct加速器、面向专业用户的Radeon PRO显卡,以及部分消费级Radeon显卡。

AMD错失了在发布时为开发者提供支持的机会,这似乎有些遗憾。颇具讽刺意味的是,RX 9070显卡所搭载的Navi 48芯片,其相关信息早在去年的ROCm更新中就已经出现。Anush Elangovan(阿努什·埃兰戈万)报告称,RDNA 4在ROCm上运行良好,并展示了在ROCm系统管理界面(rocm-smi)下运行的RX 9070系列显卡。

开发者们一直对AMD在主流硬件上对新ROCm功能的支持速度感到不满。截至本文撰写时,AMD仅在Windows系统上正式支持RX 7000和RX 6000系列显卡以及Radeon VII。部分RDNA 2显卡仅能使用HIP运行时,无法获得完整的HIP SDK支持。相比之下,Linux系统对ROCm的支持要好得多,但也仅限于RX 7900系列和Radeon VII。尽管如此,仍有一些变通方法可以让不受支持的硬件在ROCm下运行,尤其是在Linux环境中,这种方法的成功率更高。

与此同时,Nvidia的CUDA技术则显得更为成熟。它支持从2006年起发布的所有显卡。当然,更新的架构会带来更多的功能和更复杂的指令集。随着人工智能技术的飞速发展,Nvidia的数据中心加速器占据了其90%的收入,而这些加速器的核心正是CUDA。这充分说明了ROCm对于AMD在人工智能领域与Nvidia竞争的重要性。

为了进一步扩大ROCm的支持范围,下一个可能加入的产品是Strix Halo,或者是Ryzen AI MAX 300系列。Strix Halo配备了高达128GB的统一内存,它不仅仅是一款游戏笔记本,更是为大型语言模型推理和开发量身定制的设备,旨在与苹果的M系列芯片展开竞争。


文章标签: #AMD #ROCm #RDNA4 #显卡 #人工智能

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。