英伟达的DGX Spark虽是该公司的里程碑式产品,但与此同时,AMD正通过打造Strix Halo APU系列构建端侧AI霸主平台——这正是其宣称在多类AI工作负载中表现优于英伟达GB10芯片的底气所在。

若追求极致吞吐量,DGX Spark确是可靠选择;但若论最佳能效比,Strix Halo才是首选平台。
作为英伟达首款紧凑型AI设备,DGX Spark系统独具开创意义,它同时标志着英伟达自研芯片GB10的诞生。尽管性能出众,消费者却对其4000美元的定价颇有微词,认为荒谬的高价削弱了产品吸引力。而AMD旗下知名迷你电脑制造商GMKtec推出的替代方案,仅以近乎半价就提供了令人惊艳的选择。
在官方博文中,GMKtec直接叫板英伟达DGX Spark迷你超级计算机,宣称其搭载AMD Strix Halo APU的EVO-X2迷你电脑在令牌生成速度与响应时间上表现更优。该厂商对两款设备进行了多工作负载对比测试,部署了Llama 3.3 70B、Qwen3 Coder、GPT-OSS 20B及Qwen3 0.6B等开源模型,结果显示:
在Llama 3.3 70B测试中,EVO-X2以4.9令牌/秒的生成速度超越GB10的4.6令牌/秒,但首令牌响应时间0.86秒略高于后者的0.53秒;Qwen3 Coder场景下GB10以38.03令牌/秒反超,而EVO-X2凭借0.13秒的首令牌响应时间显著胜出;在GPT-OSS 20B与Qwen3 0.6B测试中,AMD平台在多数指标保持领先。
根据内部测试,Strix Halo处理器(特别是Ryzen Al Max+ 395)在大参数模型中全面压制GB10芯片,仅在小模型如Qwen3 0.6B中差距缩小。研究表明,AMD在首令牌响应时间上的优势得益于CPU+GPU+NPU架构带来的低延迟特性,其XDNA 2引擎提供了卓越的AI算力。
英伟达在部分场景的领先,则源于测试模型对吞吐量的侧重。毫无疑问,若用户追求“高吞吐、大模型”配置,搭载GB10超级芯片(FP4精度达1 PFLOP算力)的DGX Spark仍是理想之选。但在AMD平台执行实时推理任务时,后者能以低得多的成本实现“相近”性能,尤其适合延迟敏感型工作负载。
价格对比更具冲击力:GMKtec EVO-X2顶配版(128GB内存+2TB存储售价2199美元,而DGX Spark零售价达4000美元且预售价格更高。这印证了Strix Halo与GB10在能效比上的巨大鸿沟。对于寻求本地部署模型且不愿承担过高成本的用户而言,选择EVO-X2这类工作站无疑是明智之举。



