亚马逊热剧《终极名单》前景光明,计划效仿泰勒·谢里丹宇宙模式
阅读全文

锤刻创思寰宇网
英伟达详细介绍了为其布莱克韦尔系统打造的新一代ConnectX-8网卡,并称其技术如此先进,应被称为超级网卡(SuperNIC)。
据英伟达表示,人工智能训练与人工智能推理是两种不同的工作负载,需要灵活的端到端网络策略。推理是一种分离式、分区式的工作负载,对延迟敏感,且与外部世界有大量接口需求;而训练则是同步、持久的工作负载,尾部延迟会影响效率,与外部世界的接口极少。
上述ConnectX-8网卡被称为超级网卡,同时支持Spectrum-X以太网和Quantum-X无限带宽技术。
该网卡的主要亮点包括:
在数百万个GPU上部署的RDMA技术
专为人工智能带宽、延迟和规模设计的800G RDMA硬件流水线
集成负载均衡、拥塞控制和可靠性保障
深度数据路径可编程性,适应人工智能工作负载和数据中心多样化需求
与系统架构紧密集成
企业级安全性
规格方面,ConnectX-8 800G超级网卡兼容Verbs、NCCL、NIXL、DOCA API,采用800Gb/s无限带宽XDR或2x400G以太网集成Spectrum-X以太网接口,最多支持8个端口。主机I/O接口采用通过集成PCIe交换机提供的48通道PCIe Gen6。
英伟达表示,ConnectX-8 RDMA可在不同消息大小(64KB至1MB)下实现800G的无限制扩展。这款超级网卡不仅是网卡,更是连接GPU与其他集群的ASIC芯片。
该网卡首先部署于最新的英伟达布莱克韦尔GB300 NVL72系统。这些系统基于昨日发布的布莱克韦尔Ultra GPU构建。CX8 PCIe交换机可更高效节省NVLINK C2C带宽,实现网络间服务质量保障。
NVL72板上配备的两个CX8 PCIe交换机中,每个都为Grace CPU提供Gen5 x16通道,为布莱克韦尔Ultra GPU提供Gen6 x16通道;SSD则获得PCIe Gen5 x4通道。
英伟达还展示了ConnectX-8在64个GPU间的扩展能力:
随着人工智能领域日益注重扩展性,英伟达开发了ConnectX-8集成Spectrum-X以太网交换机。这是Spectrum-X以太网交换基础设施的延伸,提供带交换功能的负载均衡和拥塞控制。ConnectX-8 RDMA可扩展传统操作系统服务以支持人工智能网络,而ConnectX-8数据包处理器则确保人工智能工厂的安全性和路由功能。
为保持网络高效运行,ConnectX-8内置数据路径加速器——一个16T RISC-V事件处理器。通过这些技术和硬件级集成,Spectrum-X以太网相比商用RDMA网卡/交换机,可将训练步骤时间缩短60%,并在负载下实现近零尾部延迟。
从英伟达分享的Spectrum-X性能数据可见:
有效带宽提升1.6倍(负载均衡)
集合带宽提升1.3倍(尾部延迟)
全归约带宽提升2.2倍(噪声隔离)
全对全带宽提升1.3倍(弹性性能)
遥测采集速度加快1000倍(高频遥测)
Spectrum-X和ConnectX-8超级网卡带来800G速率和PCIe Gen6支持。该公司已在布莱克韦尔系统中推出采用这些技术的解决方案,更多细节预计将在未来数月内公布。