Switch 2开发套件严重短缺,游戏开发者无法获取
阅读全文

锤刻创思寰宇网
在2025年Hot Chips大会上,AMD详细介绍了其全新Pensando Pollara 400 AI NIC——业界首款符合超以太网联盟标准的AI智能网卡。
这款专为AI系统开发的网络接口卡带宽达到400 Gbps,与英伟达的ConnectX-7解决方案持平(但英伟达为新一代Blackwell Ultra系统配备了速度达800GbE的更高端ConnectX-8解决方案)。
Pensando Pollara的主要特性包括:
可编程硬件流水线
最高1.25倍性能提升
400 Gbps带宽
开放生态系统
支持UEC就绪的RDMA技术
缩短任务完成时间
高可用性架构
该解决方案采用与AMD EPYC处理器及Instinct加速器统一的设计理念,通过PCIe交换机连接网卡与CPU。网卡本体采用Gen5 x16接口,基于P4架构构建,其核心组件包含:
表引擎(TE):从数据包头部向量生成表键值,支持哈希或直接处理模式,并根据类型发起内存读取
匹配处理单元(MPU):具备专用指令集的域特定处理器,编译器可高效进行字段操作,提供独立的内存、表和PHV接口
技术增强方面实现了:
虚拟地址到物理地址(va2pa)转换能力
SRAM邻近的原子内存操作
基于地址范围的流水线缓存一致性管理(通过失效/更新逻辑实现)
针对横向扩展网络中的AI系统性能挑战,AMD指出包括:ECMP负载均衡导致的链路利用率低下、网络与节点拥塞、数据包丢失等问题。后端网络中的通信时间损耗尤为显著——AI网络的带宽饱和度远高于通用网络,常处于全带宽饱和状态。
核心解决方案在于采用超以太网联盟(UEC)标准:这是一个开放、可互操作的高性能全通信栈架构,能够规模化满足AI与高性能计算的网络需求,兼具性能、可扩展性和成本效益。
性能测试显示:AMD Pensando Pollara 400 AI UEC就绪RDMA网卡相较RoCEv2 4队列对方案实现25%性能提升,较RoCEv2 单队列对方案性能增幅达40%。