在本周举行的Cloud Next大会上,谷歌发布了其TPU人工智能加速芯片的最新一代产品。
这款名为“铁木(Ironwood)”的新芯片是谷歌第七代TPU,也是首款专为推理任务(即运行AI模型)优化的芯片。预计今年晚些时候面向谷歌云客户推出时,铁木将提供两种配置方案:256芯片集群和9,216芯片集群。
“铁木是我们迄今性能最强、能效最优的TPU产品,”谷歌云副总裁阿明·瓦赫达特(Amin Vahdat)在官方博文中写道,“其专为大规模思维推理型AI模型而设计。”
铁木芯片问世之际,AI加速器领域竞争正日趋白热化。虽然英伟达(Nvidia)暂居领先地位,但亚马逊(Amazon)和微软(Microsoft)等科技巨头都在力推自研方案。亚马逊通过AWS提供Trainium、Inferentia和Graviton处理器,微软则为其Maia 100 AI芯片配置了Azure实例。
据谷歌内部基准测试显示,铁木峰值计算能力可达4,614万亿次浮点运算。每颗芯片配备192GB专用内存,带宽接近7.4Tbps。该芯片搭载升级版专用核心SparseCore,专门处理“高级排序”和“推荐”类工作负载中的常见数据类型(例如预测用户偏好的服装推荐算法)。谷歌表示,TPU架构设计最大限度地减少了芯片内部数据迁移和延迟,从而实现节能降耗。
瓦赫达特补充称,谷歌计划近期将铁木整合至AI超级计算机(Google Cloud的模块化计算集群)中。
“铁木标志着推理时代的重要突破,”瓦赫达特表示,“其显著提升了计算能力、内存容量……网络性能及可靠性。”
太平洋时间上午10:45更新:前文误将微软Cobalt 100表述为AI芯片,实则为通用芯片,微软Maia 100才是AI芯片,特此更正。