Stability AI(稳定人工智能)公司近日发布了专为AMD硬件优化的ONNX模型,在兼容的Radeon显卡和移动端Ryzen AI加速处理器上运行速度最高可提升3.3倍。该公司正是知名开源图像生成模型Stable Diffusion(稳定扩散)的开发者。
由AMD与TensorStack AI联合开发的本地化创作平台Amuse(娱乐工坊)已升级至3.0版本。新版本不仅支持这些优化模型,还新增了视频扩散生成、AI照片滤镜及本地文生图等功能。需要注意的是,Amuse 3.0与AMD优化模型需搭配Adrenalin 24.30.31.05预览版驱动或即将发布的Adrenalin 25.4.1正式版驱动使用。
过去一年间,AMD与多家操作系统供应商(OEM)、独立软件开发商(ISV)展开深度合作,从硬件优化、高效驱动、编译器改进到机器学习模型调优等多个层面提升AI应用性能。基于此,Stability AI现已推出针对Radeon显卡优化的Stable Diffusion系列模型,包括Stable Diffusion 3.5(SD3.5)和Stable Diffusion XL Turbo(SDXL Turbo)。官方数据显示,相比基础PyTorch版本,SD3.5 Large模型加速比达3.3倍,SD3.5 Large Turbo为2.1倍,SDXL Turbo则为1.5倍。
人工智能虽已深入日常生活,但多数应用仍依赖云端服务需联网运行。“AI PC”概念的兴起正推动现代处理器发展,新一代芯片都配备了专用硬件单元来加速机器学习运算。以神经处理单元(NPU)和专用AI矩阵核心为例,它们使得小型高效AI模型得以在本地设备运行。
即将面世的RDNA 4架构搭载AMD第二代AI加速器,其FP16性能(支持稀疏计算)较RDNA 3提升4倍,INT8性能(同样支持稀疏计算)更可达8倍。值得注意的是,这些优化模型虽不受架构限制,但AMD建议高端显卡运行特定模型如SDXL、SD3.5 Large及Turbo版本。搭载XDNA NPU的Ryzen AI加速处理器可与Radeon集成显卡协同工作,其中大内存容量和强劲性能的Strix Halo系列尤为推荐。
专为AMD硬件优化的Stable Diffusion模型均带有“_amdgpu”后缀,现已登陆Hugging Face平台开放下载。用户可根据需求在自有环境或AMD Amuse 3.0平台中直接调用这些模型。