iPhone Air仅5.6毫米,搭载A19 Pro芯片,配备C1X 5G调制解调器与N1无线芯片
阅读全文

锤刻创思寰宇网
英伟达(Nvidia)凭借其最新一代Blackwell Ultra GB300 NVL72机架级系统,在MLPerf基准测试中打破了自身纪录。该公司宣称,在运行DeepSeek R1测试时,其推理性能相较基于Blackwell的GB200平台提升了45%。通过硬件改进与软件优化的结合,英伟达在运行多种模型时均占据榜首地位,并建议这应成为开发者构建“AI工厂”时的首要考量因素,因其可能显著提升收益生成能力。
Blackwell架构不仅是新一代RTX 50系列显卡的核心——即便AMD的RX 9000系列性价比更优,其游戏性能仍是最强的——更是GB200平台等大型AI动力GPU堆栈的基石。该平台正被部署于全球多地数据中心,为下一代AI应用提供算力支持。而Blackwell Ultra GB300作为增强版本,性能更为强大,英伟达现已通过多项令人瞩目的MLPerf纪录验证了其表现。
最新版MLPerf基准测试包含使用DeepSeek R1、Llama 3.1 405B、Llama 3.1 8B及Whisper模型的推理性能测试,GB300 NVL72在所有测试中均表现突出。英伟达声称运行DeepSeek模型时性能较GB200提升45%,相较老款Hopper GPU性能最高可达五倍——尽管公司注明该对比数据源自未经核实的第三方。
部分性能提升源于Blackwell Ultra采用的更强张量核心,英伟达宣称其“注意力层加速能力提升2倍,AI计算浮点性能提升1.5倍”。但另一重要推动力是一系列软件改进与优化。
在此次基准测试中,英伟达广泛采用其NVFP4格式,通过对DeepSeek R1权重进行量化,在保持精度的同时减小模型总体积,使Blackwell Ultra能够加速计算以实现更高吞吐量。
针对Llama 3.1 405B等更大规模的模型测试,英伟达通过跨多GPU同时“分片”处理模型,在维持延迟标准的同时提升吞吐量。这得益于其72块GPU间1.8 TBps的NVLink互联架构,总带宽达到130 TBps。
所有这些成果构成英伟达对Blackwell Ultra的核心宣传:其为“AI工厂”发展带来经济性变革。通过硬件与软件的双重优化提升推理能力,使得GB300在英伟达构想的数据中心工作负载代币化未来中,成为一个更具盈利潜力的平台。随着GB300本月即将开始出货,此时发布新基准测试结果显然并非巧合。