英伟达DGX Spark虽是该公司的里程碑式产品,但与此同时,AMD正通过打造Strix Halo APU系列构建端侧AI霸主平台——这正是其宣称在多类AI工作负载中表现优于英伟达GB10芯片的底气所在。

Cover Image

若追求极致吞吐量,DGX Spark确是可靠选择;但若论最佳能效比,Strix Halo才是首选平台。

作为英伟达首款紧凑型AI设备,DGX Spark系统独具开创意义,它同时标志着英伟达自研芯片GB10的诞生。尽管性能出众,消费者却对其4000美元的定价颇有微词,认为荒谬的高价削弱了产品吸引力。而AMD旗下知名迷你电脑制造商GMKtec推出的替代方案,仅以近乎半价就提供了令人惊艳的选择。

在官方博文中,GMKtec直接叫板英伟达DGX Spark迷你超级计算机,宣称其搭载AMD Strix Halo APUEVO-X2迷你电脑在令牌生成速度与响应时间上表现更优。该厂商对两款设备进行了多工作负载对比测试,部署了Llama 3.3 70BQwen3 CoderGPT-OSS 20BQwen3 0.6B等开源模型,结果显示:

Llama 3.3 70B测试中,EVO-X24.9令牌/秒的生成速度超越GB104.6令牌/秒,但首令牌响应时间0.86秒略高于后者的0.53秒Qwen3 Coder场景下GB1038.03令牌/秒反超,而EVO-X2凭借0.13秒的首令牌响应时间显著胜出;在GPT-OSS 20BQwen3 0.6B测试中,AMD平台在多数指标保持领先。

根据内部测试,Strix Halo处理器(特别是Ryzen Al Max+ 395)在大参数模型中全面压制GB10芯片,仅在小模型如Qwen3 0.6B中差距缩小。研究表明,AMD在首令牌响应时间上的优势得益于CPU+GPU+NPU架构带来的低延迟特性,其XDNA 2引擎提供了卓越的AI算力。

英伟达在部分场景的领先,则源于测试模型对吞吐量的侧重。毫无疑问,若用户追求“高吞吐、大模型”配置,搭载GB10超级芯片(FP4精度达1 PFLOP算力)的DGX Spark仍是理想之选。但在AMD平台执行实时推理任务时,后者能以低得多的成本实现“相近”性能,尤其适合延迟敏感型工作负载。

价格对比更具冲击力:GMKtec EVO-X2顶配版(128GB内存+2TB存储售价2199美元,而DGX Spark零售价达4000美元且预售价格更高。这印证了Strix HaloGB10在能效比上的巨大鸿沟。对于寻求本地部署模型且不愿承担过高成本的用户而言,选择EVO-X2这类工作站无疑是明智之举。


文章标签: #英伟达 #AMD #AI设备 #性能对比 #能效比

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。