在2025年Hot Chips大会上,AMD详细介绍了其全新Pensando Pollara 400 AI NIC——业界首款符合超以太网联盟标准的AI智能网卡。

Cover Image

这款专为AI系统开发的网络接口卡带宽达到400 Gbps,与英伟达ConnectX-7解决方案持平(但英伟达为新一代Blackwell Ultra系统配备了速度达800GbE的更高端ConnectX-8解决方案)。

Pensando Pollara的主要特性包括:

  • 可编程硬件流水线

  • 最高1.25倍性能提升

  • 400 Gbps带宽

  • 开放生态系统

  • 支持UEC就绪的RDMA技术

  • 缩短任务完成时间

  • 高可用性架构

该解决方案采用与AMD EPYC处理器及Instinct加速器统一的设计理念,通过PCIe交换机连接网卡与CPU。网卡本体采用Gen5 x16接口,基于P4架构构建,其核心组件包含:

  • 表引擎(TE):从数据包头部向量生成表键值,支持哈希或直接处理模式,并根据类型发起内存读取

  • 匹配处理单元(MPU):具备专用指令集的域特定处理器,编译器可高效进行字段操作,提供独立的内存、表和PHV接口

技术增强方面实现了:

  • 虚拟地址到物理地址(va2pa)转换能力

  • SRAM邻近的原子内存操作

  • 基于地址范围的流水线缓存一致性管理(通过失效/更新逻辑实现)

针对横向扩展网络中的AI系统性能挑战,AMD指出包括:ECMP负载均衡导致的链路利用率低下、网络与节点拥塞、数据包丢失等问题。后端网络中的通信时间损耗尤为显著——AI网络的带宽饱和度远高于通用网络,常处于全带宽饱和状态。

核心解决方案在于采用超以太网联盟(UEC)标准:这是一个开放、可互操作的高性能全通信栈架构,能够规模化满足AI与高性能计算的网络需求,兼具性能、可扩展性和成本效益。

性能测试显示:AMD Pensando Pollara 400 AI UEC就绪RDMA网卡相较RoCEv2 4队列对方案实现25%性能提升,较RoCEv2 单队列对方案性能增幅达40%


文章标签: #AMD #AI网卡 #UEC标准 #400Gbps #高性能

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。