英伟达详细介绍了为其布莱克韦尔系统打造的新一代ConnectX-8网卡,并称其技术如此先进,应被称为超级网卡(SuperNIC)

Cover Image

英伟达表示,人工智能训练与人工智能推理是两种不同的工作负载,需要灵活的端到端网络策略。推理是一种分离式、分区式的工作负载,对延迟敏感,且与外部世界有大量接口需求;而训练则是同步、持久的工作负载,尾部延迟会影响效率,与外部世界的接口极少。

上述ConnectX-8网卡被称为超级网卡,同时支持Spectrum-X以太网和Quantum-X无限带宽技术。

该网卡的主要亮点包括:

  • 在数百万个GPU上部署的RDMA技术

  • 专为人工智能带宽、延迟和规模设计的800G RDMA硬件流水线

  • 集成负载均衡、拥塞控制和可靠性保障

  • 深度数据路径可编程性,适应人工智能工作负载和数据中心多样化需求

  • 与系统架构紧密集成

  • 企业级安全性

规格方面,ConnectX-8 800G超级网卡兼容Verbs、NCCL、NIXL、DOCA API,采用800Gb/s无限带宽XDR2x400G以太网集成Spectrum-X以太网接口,最多支持8个端口。主机I/O接口采用通过集成PCIe交换机提供的48通道PCIe Gen6

英伟达表示,ConnectX-8 RDMA可在不同消息大小(64KB至1MB)下实现800G的无限制扩展。这款超级网卡不仅是网卡,更是连接GPU与其他集群的ASIC芯片。

该网卡首先部署于最新的英伟达布莱克韦尔GB300 NVL72系统。这些系统基于昨日发布的布莱克韦尔Ultra GPU构建。CX8 PCIe交换机可更高效节省NVLINK C2C带宽,实现网络间服务质量保障。

NVL72板上配备的两个CX8 PCIe交换机中,每个都为Grace CPU提供Gen5 x16通道,为布莱克韦尔Ultra GPU提供Gen6 x16通道;SSD则获得PCIe Gen5 x4通道。

英伟达还展示了ConnectX-864GPU间的扩展能力:

随着人工智能领域日益注重扩展性,英伟达开发了ConnectX-8集成Spectrum-X以太网交换机。这是Spectrum-X以太网交换基础设施的延伸,提供带交换功能的负载均衡和拥塞控制。ConnectX-8 RDMA可扩展传统操作系统服务以支持人工智能网络,而ConnectX-8数据包处理器则确保人工智能工厂的安全性和路由功能。

为保持网络高效运行,ConnectX-8内置数据路径加速器——一个16T RISC-V事件处理器。通过这些技术和硬件级集成,Spectrum-X以太网相比商用RDMA网卡/交换机,可将训练步骤时间缩短60%,并在负载下实现近零尾部延迟。

英伟达分享的Spectrum-X性能数据可见:

  • 有效带宽提升1.6倍(负载均衡)

  • 集合带宽提升1.3倍(尾部延迟)

  • 全归约带宽提升2.2倍(噪声隔离)

  • 全对全带宽提升1.3倍(弹性性能)

  • 遥测采集速度加快1000倍(高频遥测)

Spectrum-XConnectX-8超级网卡带来800G速率和PCIe Gen6支持。该公司已在布莱克韦尔系统中推出采用这些技术的解决方案,更多细节预计将在未来数月内公布。


文章标签: #英伟达 #超级网卡 #ConnectX8 #AI网络 #800G网卡

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。