德国硬件媒体Igor's Lab近日收到读者送测的一块故障版撼讯(PowerColor)RX 9070 XT Hellhound显卡。尽管该卡通过了出厂质检,但技术人员发现了导致温度失控的RDNA 4核心缺陷——即便重新涂抹导热膏仍无法改善。据该媒体披露,罪魁祸首是芯片背面研磨工序中产生的“明显凹坑”。
报道开篇特别说明,目前这仅是孤立案例,尚不能完全确认晶圆受损的根本原因。可能是单卡品控失误,也可能涉及整批缺陷晶圆的生产线问题。无论何种情况,现阶段尚无法评估问题波及范围。
从技术层面看,这些肉眼难辨的硅晶圆表面缺陷直接引发了异常高温。实测数据显示,GPU平均温度与热点温差高达46摄氏度,后者甚至触及113摄氏度临界值——而基于RDNA架构的芯片温度上限为110摄氏度,最终导致该卡触发降频保护。
显微镜检测显示硅晶圆表面存在超过1934个凹坑,占芯片表面积1%以上。报道指出这严重超出当代芯片(尤其是采用Navi 48核心的9070 XT这类高性能芯片)的正常公差范围。
由于RDNA 4尚未公开缺陷深度标准,实验室参考行业通用规范:“通常深度≤5-10微米且直径≤50-100微米的凹坑不被视为严重缺陷,前提是远离芯片边缘或焊接面。但在高机械应力区域(如超薄晶圆),超过2-3微米的缺陷就可能引发问题。”实测该故障卡存在直径212.36微米、深12.59微米的超标凹坑。
技术团队推测问题源自晶圆背面研磨工艺失误。这项工艺通过打磨硅片背面(安装至PCB后成为“顶部”)来调整厚度,不同设计方案的规格要求各异。类似砂纸打磨的过程可能出现研磨碎屑划伤、凹坑、剥落等问题,既影响结构完整性又削弱散热效能,不当的热机械应力也可能在研磨过程中损伤晶圆。
Igor's Lab指出多方环节存在质检疏漏:作为生产方的撼讯工厂需承担主要责任,台积电(TSMC)等环节也放行了这个缺陷样本,可能是AI检测算法训练不足所致。
AMD向该媒体确认此次故障属于“孤立事件”。考虑到当前显卡价格高企与供应短缺,希望这位用户能顺利走质保流程——若该卡系实验室自读者处购得,则理应获得换新服务。