最新动态
谷歌发布第七代TPU“Ironwood”专注于AI推理,带来每瓦性能翻倍提升
2025-04-16 13:35

谷歌宣布,推出第七代TPU“Ironwood”,旨在提升人工智能(AI)应用程序的性能。谷歌表示,新款AI芯片专注于推理计算,即聊天机器人问答和其他AI输出所需的快速计算,谷歌花了10年时间及数十亿美元来开发TPU,暂时只提供给其内部工程师或者通过谷歌的云服务使用。

图片

Google Cloud副总裁Amin Vahdat表示:“Ironwood是谷歌迄今为止功能最强大、性能最强、最节能的TPU,专为大规模支持思考和推理AI模型而设计。”

第七代TPU“Ironwood”的峰值算力为4614  TeraFLOPS(第六代TPU芯片“Trillium”的5倍),内存高达192GB(“Trillium”的6倍);HBM带宽达到7.2  Tbps(“Trillium”的4.5倍);每瓦峰值算力为29.3 TeraFLOPS(“Trillium”的2倍);增强的芯片间互连  (ICI) 带宽,双向增至1.2  Tbps(“Trillium”的1.5倍)。此外,“Ironwood”还搭载了增强版专用核心SparseCore,用于处理“高级排序”和“推荐”任务中常见的数据类型,通过最小化芯片内数据移动和延迟来实现节能。

Google Cloud为客户提供了256芯片和9216芯片两种配置选择,后者的AI算力达到了42.5 ExaFLOPS。“Ironwood”芯片将作为Google AI超级计算机架构的核心组件,通过软硬件协同优化,将有力推动生成式AI向更复杂场景演进。