随着各大AI提供商开始限制其最强大智能功能的使用额度,放弃ChatGPT、Claude和Gemini订阅、全面转向本地AI的想法愈发诱人——只要愿意花钱,这确实可行。
AMD最新推出的本地AI解决方案是一款名为“Ryzen AI Halo”的迷你PC。初看之下,它极具吸引力:Mac mini大小的机箱,搭载强大的AMD Ryzen AI Max+ 395处理器,拥有16个Zen 5 CPU核心和32线程(可升级至最先进的Ryzen AI Max+ 400系列),配备多达40个Radeon 3.5 GPU计算单元,最重要的是——128GB统一LPDDR5x内存。

最后一个规格是关键。内存对于AI推理至关重要(你可能已注意到持续的RAM短缺),没有足够的内存,系统将难以运行像OpenAI的1200亿参数GPT OSS这样的大型本地大语言模型,更不用说像LTX 2.3这样吃内存的视频生成模型了。
凭借对统一内存(即共享高速系统RAM与VRAM池)的支持,128GB AMD Ryzen AI Halo(最初在1月的CES上预告)相比独立GPU拥有关键优势:独立GPU受限于各自独立的VRAM容量,通常只有16GB、32GB或(如果买得起)48GB。
这种统一内存特性有助于解释Mac mini在OpenClaw(即个人AI代理)用户群体中流行的原因:小巧且始终在线的Mac mini M4拥有高达64GB的统一RAM——虽然只有AMD Ryzen AI Halo的一半,但也不容小觑。
当然,Mac mini和AMD AI Ryzen Halo都因缺少一项关键特性而面临严重的AI生成障碍:对英伟达CUDA平台(NVIDIA CUDA)的支持。CUDA(Compute Unified Device Architecture的缩写,这个缩略词总让我想起梭鱼)是让AI软件与英伟达GPU协同工作、实现快速AI推理的秘诀。
因此,大多数AI开发者采用“CUDA优先”的方式来构建工具,将其他架构(如苹果Metal(Apple Metal)和AMD的ROCm平台,后者在连接软件应用与AMD GPU方面扮演着类似CUDA的角色)视为次要考量。
尽管如此,AMD正试图通过一套强大的硬件来克服CUDA方面的不足:其NPU算力达到50 TOPS(衡量处理器理论AI吞吐量的指标;50 TOPS是相当不错的数字),并配备了40个AMD RDNA 3.5 GPU计算单元(对于集成GPU而言堪称巨大)。但再次强调,真正拉开差距的是那128GB统一RAM,它让AMD Ryzen AI Halo能够跟上基于英伟达的系统。
这就引出了价格问题:一台搭载Ryzen AI Max+ 395的入门级系统售价高达3,999美元。(值得注意的是,AMD仅提供Ryzen AI Halo的开发规格;实际硬件将由第三方厂商生产。)AMD尚未公布搭载更高端Ryzen AI Max+ Pro 495处理器的Ryzen AI Halo机型的售价。
所以,哇哦,对吧?对个人来说确实如此。对小型企业而言呢?也许没那么糟。
AMD算了笔账,为那些放弃云端AI并购买Ryzen AI Halo的用户算出了盈亏平衡点:他们说,假设你目前每月在云端服务上花费773美元,那么六个月就能回本。对普通用户来说这是一大笔AI开销,但对重度依赖AI的中小型企业来说,或许不算什么。
另一个需要考虑的因素是AI发展速度惊人,这意味着今天的顶级AI硬件可能两三年后就不再是顶级了。AMD方面则将其AI开发者平台作为Ryzen AI Halo在未来数月乃至数年内保持竞争力的手段。
尽管如此,AMD Ryzen AI Halo可能是一种面向小型企业用户的一体化解决方案:他们希望放手进行AI开发,而不至于破产,也不必担心AI提供商在使用额度或API成本上施压。对我们其他人来说呢?可能有点过头了。



