英伟达售价4000美元、基于Grace Blackwell GB10超级芯片的全新迷你PC平台DGX Spark正面临质疑。此前,Oculus VR前首席技术官约翰·卡马克(John Carmack)就其实际性能和功耗提出疑问,这些评论甚至引来了Framework公司和AMD的技术支持,后者主动提出提供基于AMD Strix Halo的替代方案。

卡马克在X平台发文指出,DGX Spark的功耗峰值似乎仅为100瓦,不足其标称240瓦额定功耗的一半。虽然英伟达宣传其稀疏FP4运算能力达1PFlops,但卡马克推测其稠密算力应接近125TFlops,并表示实测结果远低于该数值。他还提及设备在长时间运行中出现“自动重启”现象,质疑系统是否“在发布前已被降级”。
无独有偶,ServeTheHome的独立测试发现,零售版Spark设备在CPU+GPU联合负载下功耗仅略低于200瓦,且在任何工作负载下均无法达到240瓦的功耗上限。
受此影响,Framework公司迅速介入,主动向卡马克提供搭载AMD Strix Halo的替代设备供其测试。AMD人工智能软件副总裁阿努什·埃兰戈万(Anush Elangovan)——该公司挑战CUDA的ROCm软件公众代言人——也加入讨论,表示“将随时为您的Strix Halo探索计划提供支持”。
卡马克的发言引发业界重新审视英伟达的实际承诺。其宣传的PFlops算力数据在多个页面均标注为“FP4稀疏算力”,这隐含指向2:4结构化稀疏技术。该技术虽可提升特定矩阵运算的有效吞吐量,但在FP8或BF16等稠密格式下理论峰值会急剧下降。根据英伟达官方规格,该设备配备273GB/s内存带宽和128GB统一LPDDR5X内存,由20核Arm架构的NVIDIA Grace CPU共享,表明Spark是侧重内存容量的系统,其带宽远不及搭载HBM的GPU。
Spark的设计初衷是在内存中驻留大模型,而非追求每秒推理速度。凭借Blackwell架构,英伟达的营销甚至宣称可本地运行200亿参数模型——这是多数独立设备难以实现的壮举。但越来越多用户报告重启问题和明显的功耗瓶颈,表明英伟达在150毫米机身内设置的严格热设计功耗可能已产生负面影响。事实上,多数用户宁愿接受更大尺寸的机身,以换取更优性能和充分散热。
导致性能未达预期的具体原因尚不明确,可能是固件级限制或热节流所致。英伟达迄今未对卡马克的质疑及用户反馈的系统稳定性问题公开置评。与此同时,英伟达开发者论坛的多个线程已出现关于GPU在持续负载下崩溃和意外关机的报告。
尽管DGX Spark仍处于早期阶段,但在用户对GB10寄予厚望的背景下,英伟达亟需解释为何这款旗舰开发者套件未能释放其全部性能潜力。



