三星恢复泰勒工厂投资,加速建设2纳米生产线
阅读全文

锤刻创思寰宇网
基于RDNA 4架构的AMD当前世代Radeon RX 9000系列产品线并未试图在高端桌面GPU市场挑战英伟达。其旗舰产品Radeon RX 9070 XT对标的是英伟达的中端产品GeForce RTX 5070 Ti——后者是目前最出色的显卡之一。但根据一位资深研究员领英资料显示,该公司的图形部门似乎已为下一代产品储备了杀手锏。
AMD高级研究员兼首席片上系统(SoC)架构师拉克斯·帕普(Laks Pappu)的领英资料表明,他负责AMD数据中心GPU开发以及Radeon产品面向云游戏的架构设计,涵盖Navi4x和Navi5x世代。他将自己的工作描述为“基于多种封装技术打造具有下一代竞争力的2.5D/3.5D小芯片及单片图形SoC”,这充分暗示AMD下一代图形处理器将采用单片与多芯片组合设计。
拉克斯·帕普在英特尔工作超过25年后,于2022年8月加入AMD。他在英特尔期间负责代号为DG1、Alchemist和Battlemage的独立图形处理器开发,并探索过面向高端显卡的“多芯片GPU”技术——不过目前双GPU的Battlemage产品主要针对人工智能工作负载而非图形处理。
高端游戏和数据中心GPU通常遵循2.5至3.5年的开发周期(从架构构思到最终产品:架构定义和模块级规划约需一年,物理实现根据设计复杂度和晶体管数量再需1-1.5年,流片和硅晶圆启动又需一年)。当帕普于2022年8月加入AMD时,RDNA 4和CDNA 4架构虽已定型,但他仍在物理实现(平衡性)、模块配置、功耗性能权衡及最终芯片调优方面产生重要影响。因此,尽管未负责RDNA 4和CDNA 4的架构定义或开发,他对Radeon RX 9000系列和Instinct MI350系列产品的影响仍至关重要。
与此同时,由于他参与Navi 5x世代及可能存在的Instinct MI500系列开发,这将成为他首次全程主导的架构设计。若其领英职位描述准确,Navi 5x很可能采用2.5D或3.5D封装。
尽管AMD的Instinct MI300系列和英伟达面向人工智能与高性能计算的Blackwell系列数据中心GPU采用分解式设计,但现有消费级GPU均未依赖多芯片架构(Navi 31除外,其以不同方式实现设计分解)。
构建多芯片消费级GPU极具挑战性,原因在于图形处理工作负载的紧密耦合特性以及对处理单元间超高速、低延迟通信的需求。与可容忍核心或小芯片间延迟的CPU不同,GPU依赖数千个必须精确快速协调的并行线程(尤其在线程束或线程组内)。将着色器核心分散到多个晶粒会引入同步开销、延迟损失和复杂的一致性要求,从而显著降低性能或增加功耗。此外,保持芯片间高带宽需要先进封装技术和互连方案(如Infinity Fabric或CoWoS),这会推高成本和功耗。软件和驱动程序还需将多芯片GPU呈现为单一设备给操作系统和游戏引擎,进一步增加复杂度。这些架构、制造和软件层面的障碍使得多芯片设计目前主要局限于数据中心和HPC GPU领域——该领域的经济效益和工作负载更值得进行这种权衡。
然而,随着大型游戏GPU(如英伟达的GB102)制造难度和成本持续攀升,开发面向消费者的多芯片图形处理器终将具有现实意义。分解式多芯片设计有助于提高晶圆级良率(尽管先进封装也会消耗部分良率),但封装复杂度和中介层/桥接芯片会导致成本上升。若AMD能解决计算分解问题,完全可能为客户端应用打造多芯片GPU。
AMD是首家为数据中心和消费级CPU采用多小芯片设计的公司,因此未来若对图形处理单元进行分解并不令人意外。事实上,AMD的Radeon RX 7900系列Navi 31处理器已采用包含一个主图形核心芯片(GCD)和六个缓存/内存控制器/物理层小芯片的分解设计,这完全可以视为多芯片GPU的实验性探索。此外,Navi 31的GCD布局显示出高度对称性,意味着若AMD能在逻辑层面实现设计分解并使软件将其识别为单片GPU,该芯片可被“对半分割”。对Navi 31而言,这种设计使AMD能够从单一设计衍生出多款产品(Radeon RX 7900 XTX、RX 7900 XT、RX 7900 GRE、RX 7900M),但理论上若妥善实现计算分解,完全可以构建多芯片GPU。
从帕普的领英资料来看,他在英特尔期间确实构想过多芯片“光环”GPU,目前正致力于基于RDNA 5架构的“下一代竞争力2.5D/3.5D小芯片及单片图形SoC”开发。
关于RDNA 5的发布时间,AMD通常遵循两年周期的GPU发布节奏。公司原定2024年末发布基于RDNA 4的Radeon RX 9070系列产品,但已推迟至2025年3月。因此完全有理由预计RDNA 5将于2026年末或2027年初面世。
截至2025年8月,RDNA 5(Navi 5x)很可能处于流片或流片后初期阶段,意味着架构和RTL设计已完成,物理设计与验证接近尾声,AMD正在最终化或刚将GPU的GDSII文件交付台积电进行初步硅晶圆制造。这与2026年末至2027年初的发布窗口相符,表明RDNA 5距离实体硬件问世尚有数月之遥,但性能预测、固件开发和初期驱动程序工作已在内部全面展开。未来几个月,AMD将通过实际硬件测试判定多芯片设计对消费级GPU的可行性。因此未来数月很可能出现值得关注的技术泄露,敬请保持关注。