随着OpenAI发布GPT-OSS 20B120B两款人工智能模型,AMD宣布其锐龙AI MAX处理器与Radeon显卡将通过增强功能全面支持这些模型。

Cover Image

AMD锐龙AI MAX+ 395 APU成为目前唯一能原生运行OpenAI GPT-OSS 120B模型的AI芯片,同时Radeon显卡系列也宣布提供支持。昨日OpenAI发布的全新GPT-OSS 20B120B模型作为2019年GPT-2的开源权重继承者,已获得AMD锐龙AI处理器与Radeon显卡的即日支持,用户可通过LM Studio进行体验。

GPT-OSS是具备复杂推理与代理能力的开源权重模型。虽然多数AI电脑和芯片能运行20B版本,但120B模型需要更强硬件支持——这正是AMD Strix Halo锐龙AI MAX芯片的优势领域。这些芯片最高支持128GB内存池,专为原生处理此类AI模型设计。

GGML转换的MXFP4权重约需61GB显存,可轻松适配AMD锐龙AI Max+ 395处理器96GB专用显存。需注意,必须安装AMD Software: Adrenalin Edition 25.8.1 WHQL或更高版本驱动才能解锁该功能。

凭借每秒30个token的处理速度,AMD用户不仅能获得数据中心级尖端模型体验,锐龙AI Max+平台带宽与OpenAI GPT-OSS 120B专家混合架构的结合更带来卓越性能。大内存设计使锐龙AI Max+ 395(128GB)还能支持该模型的上下文协议(MCP)实现。采用AMD锐龙AI 300系列处理器的用户则可充分发挥较小20B模型的优势。

若需在OpenAI GPT-OSS 20B模型上实现闪电级性能,用户可在桌面系统中使用AMD Radeon 9070 XT 16GB显卡。该配置不仅提供高速token处理能力,更具备显著的首token延迟(TTFT)优势——这意味着采用20B模型上下文协议(MCP)实现的用户在计算密集型场景中将获得极速响应体验。

AMD锐龙AI处理器与Radeon显卡上体验OpenAI GPT-OSS 120B20B模型的操作指南:

  1. 下载安装AMD Software: Adrenalin Edition 25.8.1 WHQL或更高版本驱动(旧版驱动可能导致性能下降或功能缺失)

  2. 使用锐龙AI设备的用户需右键桌面选择AMD Software: Adrenalin Edition>进入性能选项卡>调整选项卡>变量图形内存>按规格表设置VGMRadeon显卡用户可跳过此步骤

  3. 下载安装LM Studio后跳过引导界面

  4. 进入发现选项卡(放大镜图标),搜索“gpt-oss”,选择左侧带“LM Studio community”前缀的20B120B版本(需与产品矩阵匹配)下载

  5. 转入聊天选项卡,顶部下拉菜单选择OpenAI模型并勾选“手动加载参数”

  6. 将“GPU卸载”滑块调至最大,勾选记住设置

  7. 点击加载(120B模型加载时间较长,进度条可能暂时停滞属正常现象)

  8. 开始输入指令

AMD同步公布了产品支持列表:锐龙AI MAX+ 395是唯一支持120B模型的芯片,而包括Radeon RX 9000Radeon AI PRO R9000及显存不低于16GBRadeon RX 7000系列显卡均可流畅运行GPT-OSS 20B模型。


文章标签: #AMD #OpenAI #锐龙AI #Radeon #GPTOSS

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。