英伟达软硬件升级，Blackwell Ultra GB300称霸MLPerf基准测试

英伟达（Nvidia）凭借其最新一代Blackwell Ultra GB300 NVL72机架级系统，在MLPerf基准测试中打破了自身纪录。该公司宣称，在运行DeepSeek R1测试时，其推理性能相较基于Blackwell的GB200平台提升了45%。通过硬件改进与软件优化的结合，英伟达在运行多种模型时均占据榜首地位，并建议这应成为开发者构建“AI工厂”时的首要考量因素，因其可能显著提升收益生成能力。

Cover Image

Blackwell架构不仅是新一代RTX 50系列显卡的核心——即便AMD的RX 9000系列性价比更优，其游戏性能仍是最强的——更是GB200平台等大型AI动力GPU堆栈的基石。该平台正被部署于全球多地数据中心，为下一代AI应用提供算力支持。而Blackwell Ultra GB300作为增强版本，性能更为强大，英伟达现已通过多项令人瞩目的MLPerf纪录验证了其表现。

最新版MLPerf基准测试包含使用DeepSeek R1、Llama 3.1 405B、Llama 3.1 8B及Whisper模型的推理性能测试，GB300 NVL72在所有测试中均表现突出。英伟达声称运行DeepSeek模型时性能较GB200提升45%，相较老款Hopper GPU性能最高可达五倍——尽管公司注明该对比数据源自未经核实的第三方。

部分性能提升源于Blackwell Ultra采用的更强张量核心，英伟达宣称其“注意力层加速能力提升2倍，AI计算浮点性能提升1.5倍”。但另一重要推动力是一系列软件改进与优化。

在此次基准测试中，英伟达广泛采用其NVFP4格式，通过对DeepSeek R1权重进行量化，在保持精度的同时减小模型总体积，使Blackwell Ultra能够加速计算以实现更高吞吐量。

针对Llama 3.1 405B等更大规模的模型测试，英伟达通过跨多GPU同时“分片”处理模型，在维持延迟标准的同时提升吞吐量。这得益于其72块GPU间1.8 TBps的NVLink互联架构，总带宽达到130 TBps。

所有这些成果构成英伟达对Blackwell Ultra的核心宣传：其为“AI工厂”发展带来经济性变革。通过硬件与软件的双重优化提升推理能力，使得GB300在英伟达构想的数据中心工作负载代币化未来中，成为一个更具盈利潜力的平台。随着GB300本月即将开始出货，此时发布新基准测试结果显然并非巧合。

搜索结果如下

阅读全文

英伟达软硬件升级，Blackwell Ultra GB300称霸MLPerf基准测试

也可以看看

好评率98%的免费Steam游戏，《与死神约会》的视觉小说不可错过

阅读全文

任天堂已备好绝佳剧本，《任天堂明星大乱斗》电影呼之欲出

阅读全文

《辐射》传奇模组内容庞大，助你度过《辐射5》等待期

阅读全文