随着OpenAI发布GPT-OSS 20B和120B两款人工智能模型,AMD宣布其锐龙AI MAX处理器与Radeon显卡将通过增强功能全面支持这些模型。

AMD的锐龙AI MAX+ 395 APU成为目前唯一能原生运行OpenAI GPT-OSS 120B模型的AI芯片,同时Radeon显卡系列也宣布提供支持。昨日OpenAI发布的全新GPT-OSS 20B和120B模型作为2019年GPT-2的开源权重继承者,已获得AMD锐龙AI处理器与Radeon显卡的即日支持,用户可通过LM Studio进行体验。
GPT-OSS是具备复杂推理与代理能力的开源权重模型。虽然多数AI电脑和芯片能运行20B版本,但120B模型需要更强硬件支持——这正是AMD Strix Halo或锐龙AI MAX芯片的优势领域。这些芯片最高支持128GB内存池,专为原生处理此类AI模型设计。
经GGML转换的MXFP4权重约需61GB显存,可轻松适配AMD锐龙AI Max+ 395处理器96GB专用显存。需注意,必须安装AMD Software: Adrenalin Edition 25.8.1 WHQL或更高版本驱动才能解锁该功能。
凭借每秒30个token的处理速度,AMD用户不仅能获得数据中心级尖端模型体验,锐龙AI Max+平台带宽与OpenAI GPT-OSS 120B专家混合架构的结合更带来卓越性能。大内存设计使锐龙AI Max+ 395(128GB)还能支持该模型的上下文协议(MCP)实现。采用AMD锐龙AI 300系列处理器的用户则可充分发挥较小20B模型的优势。
若需在OpenAI GPT-OSS 20B模型上实现闪电级性能,用户可在桌面系统中使用AMD Radeon 9070 XT 16GB显卡。该配置不仅提供高速token处理能力,更具备显著的首token延迟(TTFT)优势——这意味着采用20B模型上下文协议(MCP)实现的用户在计算密集型场景中将获得极速响应体验。
在AMD锐龙AI处理器与Radeon显卡上体验OpenAI GPT-OSS 120B和20B模型的操作指南:
下载安装AMD Software: Adrenalin Edition 25.8.1 WHQL或更高版本驱动(旧版驱动可能导致性能下降或功能缺失)
使用锐龙AI设备的用户需右键桌面选择AMD Software: Adrenalin Edition>进入性能选项卡>调整选项卡>变量图形内存>按规格表设置VGM;Radeon显卡用户可跳过此步骤
下载安装LM Studio后跳过引导界面
进入发现选项卡(放大镜图标),搜索“gpt-oss”,选择左侧带“LM Studio community”前缀的20B或120B版本(需与产品矩阵匹配)下载
转入聊天选项卡,顶部下拉菜单选择OpenAI模型并勾选“手动加载参数”
将“GPU卸载”滑块调至最大,勾选记住设置
点击加载(120B模型加载时间较长,进度条可能暂时停滞属正常现象)
开始输入指令
AMD同步公布了产品支持列表:锐龙AI MAX+ 395是唯一支持120B模型的芯片,而包括Radeon RX 9000、Radeon AI PRO R9000及显存不低于16GB的Radeon RX 7000系列显卡均可流畅运行GPT-OSS 20B模型。



