据报道,谷歌(Google)正与Marvell合作开发两款芯片,其中一款旨在优化现有的张量处理单元(TPU),另一款则是全新的下一代TPU设计。

Cover Image

根据The Information的报道,谷歌Marvell已就开发两款专为人工智能推理设计的全新芯片展开洽谈。

据两位直接了解讨论情况的人士透露,谷歌正在与Marvell Technology洽谈,合作开发两款旨在更高效运行人工智能模型的新芯片。其中一款是内存处理单元,设计用于与谷歌的张量处理单元协同工作。另一款则是专门为运行人工智能模型而打造的全新TPU。

虽然目前谈判所处的具体阶段尚不明确,但根据初步评估,谷歌已提出两款芯片方案:一款旨在提升现有TPU性能,第二款则是全新的TPU设计。这表明双方已设定了合作的基础框架。

讨论中的两款芯片在用途上截然不同。第一款与TPU相关,但它并非定制的TPU芯片,而是一个将与TPU配对使用的内存处理单元。我们可以将其视为内存处理技术的一个方面,这个特定的加速器或知识产权模块将分担芯片或系统的部分内存需求,并将其转移到专用的MPU上处理。

讨论中的第二款芯片是下一代TPU,它将专门针对人工智能推理模型进行优化。目前,谷歌的旗舰人工智能加速器是其TPU v7或Ironwood系列。TPU v7提供192 GB的HBM内存,峰值性能达到4614 TFLOPs,并被封装在由9216个芯片组成的Superpod中。

尽管专用集成电路被视为人工智能推理领域的重要发展方向,但当前供应链中的挑战依然存在。有报告称,市场对谷歌TPU(如Ironwood)的需求正在增长,但我们也必须考虑到生产因素,目前每家主要半导体公司的产能都已达到极限。

MPU听起来更像是一个次级推理加速器,类似于英伟达(NVIDIA)的Groq 3 LPX(一种语言处理单元)。该LPU集成了500 MB的SRAM内存,总带宽速率高达惊人的150 TB/s,并在即将推出的Vera Rubin平台上最大化地支持代理人工智能工作负载。

根据报道,我们可以预期,下一代谷歌TPU与上述MPU的结合,将进一步加速内存子系统,从而提升人工智能模型的运行性能,尤其是在推理环节。


文章标签: #谷歌 #Marvell #AI芯片 #TPU #AI推理

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。