马斯克重申xAI五年部署5000万GPU,开源Grok 2.5
阅读全文

锤刻创思寰宇网
英伟达近日对其最强人工智能芯片Blackwell Ultra GB300进行了深度技术解析。这款芯片较GB200性能提升50%,配备288GB内存,目前已完成量产并交付核心客户。
作为Blackwell架构的增强版本,GB300采用双光罩尺寸晶粒设计,通过NV-HBI高速互联接口实现一体化运行。该芯片基于台积电4NP制程工艺(为英伟达优化的5纳米技术),集成2080亿个晶体管,互联带宽达10TB/秒。
核心配置方面,GB300集成160个流式多处理器,包含20,480个CUDA核心和640个第五代张量核心,支持FP8/FP6/NVFP4多种精度计算,同时配备40MB张量内存。其HBM3e内存容量从上一代的192GB提升至288GB,通过8组堆栈和16个512位控制器实现8TB/秒带宽,可支持3000亿参数级大模型全内存驻留。
互联技术采用第五代NVLink架构,单GPU双向带宽达1.8TB/秒,最多支持576个GPU无损组网。同时集成PCIe Gen6×16接口(256GB/秒双向带宽)和NVLink-C2CCPU-GPU一致性互联方案(900GB/秒)。
性能表现上,采用NVFP4新标准的密集低精度计算性能提升50%,在保持接近FP8精度(误差小于1%)的同时,内存占用较FP8减少1.8倍,较FP16减少3.5倍。
企业级功能方面带来三项重大升级:新一代GigaThread引擎优化了160个流处理器的任务调度;多实例GPU(MIG)支持灵活分区(如2个140GB实例或7个34GB实例);机密计算系统通过可信执行环境(TEE)和NVLink加密实现安全AI运算。新增的远程认证服务(RAS)引擎可监测数千参数实现故障预测。
能效比数据显示,Blackwell Ultra在单位功耗交易处理量(TPS/MW)指标上全面优于前代产品。通过每年迭代的硬件升级与深度软件优化,英伟达持续巩固其在人工智能计算领域的领先地位。