谷歌的张量处理器(TPU)因有报道称其获得外部采用而在整个人工智能领域成为头条新闻。然而,此事有一个角度可能会构成重大制约。

在当今的人工智能计算领域,人们对专用集成电路(ASIC)的兴趣巨大,主要是因为人们相信,在人工智能应用的下一个层级——即推理环节——像谷歌TPU这样的芯片将以更好的总体拥有成本(TCO)和性能能力占据主导地位。随着谷歌第七代“铁木”(Ironwood)TPU的推出,Meta和Anthropic等公司表现出将这类ASIC集成到其工作负载中的兴趣,关于TPU获得外部采用的叙事也获得了动力。然而,如果谷歌打算进入基础设施市场,供应链制约将构成重大挑战。
据《中国时报》报道,谷歌的TPU可能在芯片产量方面无法达到市场预期,这主要源于该公司难以从台积电(TSMC)等供应商处获得成功扩大生产所必需的高级封装供应。诸如CoWoS(Chip-on-Wafer-on-Substrate)等技术是芯片制造商相对于前代产品大幅提升性能的一种方式。就TPUv7而言,谷歌采用了多芯片模块(MCM)设计,这使得该公司能够将多个芯片集成到一个统一的封装中。
TPUv7并非采用大型单片芯片,而是在硅中介层上集成了多个硅芯片,并采用微凸点阵列来连接这些小芯片。这最终实现了可扩展性,并专门针对矩阵乘法器和推理架构优化了内部设计。有趣的是,“铁木”还通过中介层布线,将网络物理层(PHY)和路由逻辑直接集成到封装中,最终实现了超低延迟的芯片到芯片(D2D)连接。高级封装是谷歌TPU技术栈不可或缺的一部分,这就是为什么该公司必须确保足够的产能来增加外部采用。
富邦研究预测,2026年谷歌TPU的出货量将低于主流分析公司的预测,主要是因为CoWoS的瓶颈过于显著,不容忽视。台积电现有的供应链已完全服务于苹果和英伟达(NVIDIA)的产品,这就是为什么即使在台积电投入巨资扩大产能之后,为其高级封装业务引入额外客户也是一个有问题的举措。由于在批量制造方面,谷歌将是供应链中相对较新的进入者,它无疑排在队列的末尾。
这当然并不意味着TPU不会被采用,而是行业内的瓶颈使得谷歌难以为广泛的客户提供其定制芯片。谷歌解决此问题的一种方式是利用英特尔(Intel)或安靠(Amkor)等公司进行高级封装,并且有传言称这家科技巨头已经在探索嵌入式多芯片互连桥接(EMIB-T)解决方案。在满足客户订单方面,人工智能供应链具有高度不可预测性,这就是为什么我们无法确定谷歌的下一步行动将是什么。



