著名的智能编码平台Claude Code仅用半小时就将英伟达(NVIDIA)CUDA代码移植到了ROCm平台,这或许为弥合两个生态系统之间的鸿沟提供了可能。

Cover Image

然而,对于较简单的内核,使用Claude Code进行从CUDAROCm的移植或许可行,但对于复杂的转换则不然。

智能体工作负载确实是人工智能的下一个主要应用方向,随着Claude Code谷歌(Google)Antigravity等产品的推出,编码社区已被这些平台展现的能力所颠覆。不过,似乎有一位Reddit用户真的利用Claude Code弥合了CUDAROCm之间的差距。据用户johnnytshi称,他仅用30分钟就借助人工智能将一整个CUDA后端移植到了AMDROCm平台上,期间没有使用任何翻译层。

这其中有很多细节值得探讨,包括使用Claude移植代码是否是一个可行的选择。但据该用户称,他们遇到的唯一问题是“数据布局”差异。对于那些不了解的人来说,Claude Code在一个智能体框架内运行,这意味着它能智能地将CUDA关键字替换为ROCm关键字,同时确保特定内核的底层逻辑保持一致,而不是简单地替换代码关键字。当然,另一个优势是你不需要设置复杂的翻译环境,例如Hipify,而是可以直接使用命令行界面来完成移植工作。

不过,这位Reddit用户没有具体说明他处理的是哪种类型的代码库。由于ROCm本质上模仿了英伟达CUDA平台的多个方面,因此对于人工智能来说,简单的移植并不复杂。但一旦涉及到相互关联的代码库,情况就会变得有趣起来,这将需要智能体系统拥有大量的上下文信息才能有效地移植到ROCm。更重要的是,由于编写内核的核心在于确保“深度硬件”优化,有人认为Claude Code在这方面仍然存在不足,尤其是在处理特定的缓存层次结构时。

打破CUDA“护城河”的努力已经进行了好几个月,例如ZLUDA等项目以及微软(Microsoft)等公司的内部努力,但在为GPU加速性能编写内核方面,英伟达仍然是主导者。


文章标签: #ClaudeCode #CUDA #ROCm #代码移植 #AI编程

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。