自主研发GPU编程软件栈MUSA近日首次公开亮相,标志着中国在技术自主化领域取得新突破。作为英伟达(Nvidia)CUDA生态的替代方案,该软件专为国产MUSA架构MTT系列GPU设计。目前官方尚未透露其是否基于开源技术,推测可能采用闭源模式,对海外开发者实际应用价值有限。
美国最新技术出口管制涵盖高端人工智能芯片、高带宽存储器(HBM)、半导体制造设备及多家企业晶圆产品。为降低对西方技术的依赖,中国正着力构建涵盖芯片设计、制造设备、存储器、中央处理器和图形处理器的完整半导体生态。其中GPU发展尤为关键,因为现代机器学习技术(常被称为人工智能)高度依赖GPU的并行计算加速能力。
成熟的GPU编程生态需要具备高级抽象层、即用型函数库、完善文档和性能分析工具。在高端英伟达GPU进口受限的背景下,MUSA为开发者提供了新的技术选择。
MUSA生态核心组件包含:
内置编译器(MCC)
运行时库(MUSA Runtime)
专业加速库集合(MUSA-X)
调试与性能分析工具
为兼容现有CUDA代码,该套件集成Musify代码转换工具,其运行时PTX代码转换机制与zLUDA技术原理相似。
当前发布的MUSA SDK 4.0.1支持英特尔x86处理器(Ubuntu系统)和海光平台(麒麟系统)。官网展示的语音合成、AI图像生成、图像处理等技术演示,部分案例据称运行于MTT S3000数据中心GPU,用户注册后即可体验。
尽管CUDA在技术成熟度和支持体系方面占据优势,但MUSA有望在特定领域逐步积累用户。AI开发社区期待建立硬件无关的开源平台生态,要真正打破CUDA垄断,仍需更具竞争力的替代方案——AMD的ROCm平台虽是重要竞争者,但其硬件支持范围仍不及英伟达。