英伟达(NVIDIA)持续优化其DGX Spark AI迷你PC,带来了高达2.5倍的性能提升,从而实现更快的生成式AI内容创造和更多可能性。

英伟达(NVIDIA) 推出的DGX Spark是一款专为AI工作负载设计的迷你超级计算机,已于2023年10月15日正式推出,自问世以来,便在同类产品中备受关注。自发布以来,该设备已进行了多次更新和优化,包括最新的OTA更新,进一步提升了性能和稳定性。
如今,英伟达(NVIDIA)宣布,凭借对NVFP4的支持,DGX Spark在通义千问Qwen-2-72B模型(配对两台DGX Spark)上可实现高达2.5倍的性能提升。通过CUDA优化,DGX Spark在英伟达Omniverse Issac Sim中的性能提高了2倍,而包括通义千问Qwen-3 30B和Stable Diffusion 3.5在内的其他模型也获得了超过30%的性能提升,PyTorch更新同样带来了显著增益。
英伟达(NVIDIA)还在扩展新的DGX Spark Playbooks,以帮助开发者构建和运行AI工作负载。新的更新包括七套全新的playbooks和四项重大更新,它们涵盖:
用于推理的vLLM
用于推理的SGLang
用于推理和推测性解码的TRT-LLM
本地运行Nemotron-3-Nano
单细胞RNA测序
量化投资组合优化
Live VLM WebUI
在Issac Sim和Issac Lab中的机器人工作流
英伟达(NVIDIA)还重点介绍了DGX Spark系统的一些有趣用例,它可以作为“减负”设备来加速创作者的工作流。一个例子展示了如何将DGX Spark与一台苹果MacBook Pro配对,将AI视频生成速度加快8倍。该示例利用DGX Spark的NVFP4和NVFP8能力,结合RTX视频超分辨率技术,能在仅一分钟内生成一部4K视频,而此前在MacBook Pro上生成相同内容需要8分钟的常规时间。
另一个例子展示了DGX Spark被用于RTX Remix等3D创作工作负载。在这种情况下,用户可以在配备了RTX GPU的系统中使用DGX Spark来处理纹理生成等工作负载,而RTX 5090则专注于处理更具创造性的密集型任务,从而解放了自身资源。无论是计算密集型还是内存密集型任务,都可以卸载到拥有128 GB统一内存的Spark系统上,以实现更快、更精准的模组增强。
除此之外,英伟达(NVIDIA) DGX Spark还能够离线运行Nsight Copilot AI进行CUDA开发。由于Nsight Copilot AI的大小(size限制),目前通常只在云端可行。凭借128 GB的统一内存和1 PFLOP的计算能力,Nsight Copilot可以在DGX Spark上无缝运行。
总体而言,这些更新证明,对于那些希望显著加速其AI任务的AI开发者和内容创作者来说,DGX Spark是一个绝佳的选择。



