著名的智能编码平台Claude Code仅用半小时就将英伟达(NVIDIA)的CUDA代码移植到了ROCm平台,这或许为弥合两个生态系统之间的鸿沟提供了可能。

然而,对于较简单的内核,使用Claude Code进行从CUDA到ROCm的移植或许可行,但对于复杂的转换则不然。
智能体工作负载确实是人工智能的下一个主要应用方向,随着Claude Code和谷歌(Google)的Antigravity等产品的推出,编码社区已被这些平台展现的能力所颠覆。不过,似乎有一位Reddit用户真的利用Claude Code弥合了CUDA和ROCm之间的差距。据用户johnnytshi称,他仅用30分钟就借助人工智能将一整个CUDA后端移植到了AMD的ROCm平台上,期间没有使用任何翻译层。
这其中有很多细节值得探讨,包括使用Claude移植代码是否是一个可行的选择。但据该用户称,他们遇到的唯一问题是“数据布局”差异。对于那些不了解的人来说,Claude Code在一个智能体框架内运行,这意味着它能智能地将CUDA关键字替换为ROCm关键字,同时确保特定内核的底层逻辑保持一致,而不是简单地替换代码关键字。当然,另一个优势是你不需要设置复杂的翻译环境,例如Hipify,而是可以直接使用命令行界面来完成移植工作。
不过,这位Reddit用户没有具体说明他处理的是哪种类型的代码库。由于ROCm本质上模仿了英伟达CUDA平台的多个方面,因此对于人工智能来说,简单的移植并不复杂。但一旦涉及到相互关联的代码库,情况就会变得有趣起来,这将需要智能体系统拥有大量的上下文信息才能有效地移植到ROCm。更重要的是,由于编写内核的核心在于确保“深度硬件”优化,有人认为Claude Code在这方面仍然存在不足,尤其是在处理特定的缓存层次结构时。
打破CUDA“护城河”的努力已经进行了好几个月,例如ZLUDA等项目以及微软(Microsoft)等公司的内部努力,但在为GPU加速性能编写内核方面,英伟达仍然是主导者。



