英伟达发布鲁宾CPX AI芯片,配备128GB GDDR7显存,专注高效推理工作负载
阅读全文

锤刻创思寰宇网
英特尔公布了其搭载Arc Pro B60显卡的Project Battlematrix工作站平台在MLPerf v5.1基准测试中的新成绩。该平台在性价比方面展现出显著优势:相较于英伟达L40S实现高达4倍的每美元性能提升,对比RTX PRO 6000也有25%的性能价格比优势。
在Llama 8B测试中,英特尔Arc Pro B60的每美元性能分别达到英伟达RTX Pro 6000的1.25倍和L40S的4倍。这些结果凸显了全英特尔平台在处理高端工作站及边缘应用中新兴AI推理工作负载时的性能表现与成本优势。
此次发布的意义在于,此前专业用户在选择能提供高推理性能、不妥协数据隐私且无需承担专有AI模型高额订阅费用的平台时选择有限,而新一代Project Battlematrix英特尔GPU系统正是为满足现代AI推理需求设计的一体化推理平台,集成了经过全栈验证的硬件与软件。
该平台通过为Linux环境构建的全新容器化解决方案简化部署流程,通过多GPU扩展和PCIe P2P数据传输优化实现卓越推理性能,并配备ECC内存纠错、SRIOV虚拟化、遥测及远程固件更新等企业级可靠性与可管理特性。
CPU在AI系统中持续扮演关键角色。作为协调中枢,CPU负责预处理、数据传输及整体系统协调。英特尔过去四年在CPU AI性能上的持续改进,已使英特尔至强成为GPU驱动系统中托管和管理AI工作负载的首选处理器。值得注意的是,搭载P核的英特尔至强6处理器在MLPerf Inference v5.1中实现了代际性能1.9倍的提升。
英特尔仍是唯一向MLPerf提交服务器CPU测试结果的厂商,这体现了其在计算与加速器架构领域加速AI推理能力的领导地位和坚定承诺。