英特尔刚刚发布了其最新的MLPerf推理v6.0基准测试结果,展示了Arc Pro B70和Arc Pro B60显卡的强劲性能。

英特尔持续的人工智能优化为现有的Arc Pro显卡带来了18%的性能提升,而Arc Pro B70相比Arc Pro B60更是实现了高达80%的性能飞跃。
MLCommons刚刚发布了其最新的MLPerf推理v6.0基准测试,展示了各种显卡和处理器的人工智能推理性能。今天的成绩对英特尔而言意义非凡,因为这是其最新发布的Arc Pro B70和Arc Pro B65显卡的首次亮相,这两款显卡均采用了全新的Big Battlemage芯片。
今天的测试是在一个由四张英特尔Arc Pro B70和Arc Pro B65显卡组成的系统上进行的,该系统拥有高达128 GB的显存,能够轻松运行1200亿参数模型。该系统使用了英特尔最新的至强6处理器,其推理性能比前代旗舰Arc Pro B60(每张显卡24 GB显存)高出80%。
除了显卡,英特尔还将其至强6处理器提交至MLPerf推理v6.0进行测试。最新的配备性能核的至强6产品线,凭借内置的AMX和AVX-512等功能,实现了高达90%的代际性能提升。
配备新发布的英特尔Arc Pro B70/B65显卡的系统,旨在满足现代人工智能推理的需求,并提供结合了全栈验证硬件和软件的一体化推理平台。凭借增强的内存容量,它们旨在通过为Linux环境构建的容器化解决方案简化采用和使用难度,并通过多显卡扩展和PCIe点对点数据传输进行优化,以提供卓越的推理性能,同时设计包含了企业级的可靠性和可管理性功能,如ECC、SRIOV、遥测和远程固件更新。例如,与同类竞争对手的显卡解决方案相比,英特尔Arc Pro B70在多显卡配置中能够处理显著更大的模型和上下文窗口——在运行大型模型时,其KV缓存容量最高可达竞品的1.6倍。
人工智能推理的性能定义日益不仅限于显卡吞吐量,还包括处理器加速的系统性能。处理器影响着整体集群效率和总拥有成本,同时还负责内存管理、任务编排和工作负载分配等关键功能,并确保现代人工智能基础设施所必需的安全性、可靠性和运营连续性。
英特尔仍然是唯一为MLPerf推理基准测试提交独立处理器结果的服务器处理器供应商,这凸显了其在推进以计算和加速器为中心的平台的人工智能推理方面的领导地位和坚定承诺。作为人工智能加速系统中使用最广泛的主机处理器——超过一半的MLPerf 6.0提交结果由至强处理器驱动——英特尔进一步巩固了其作为行业人工智能基础设施核心的地位。这一领导力也延伸至芯片本身:配备性能核的英特尔至强6处理器在MLPerf推理v5.1中实现了高达1.9倍的代际性能提升,而内置的AMX和AVX512等人工智能加速技术,使得大语言模型推理、微调和经典机器学习等工作负载无需专用加速器硬件即可高效运行。
很高兴看到英特尔持续为其现有的显卡和处理器进行推理优化,这一点在MLPerf推理v6.0基准测试中得到了体现。Arc Pro是一款非常强大的人工智能显卡,它以低于1000美元的价格提供了32 GB显存和强大的人工智能算力。预计这款显卡将很快在零售市场上市。



