当前位置:首页 > AI资讯 > 正文内容

谷歌TPU一分为二:AI算力进入分工时代

admin1个月前 (04-30)AI资讯71

当AI进入“分工时代”:谷歌TPU为何一分为二?

在拉斯维加斯的Google Cloud Next大会上,谷歌高级副总裁Amin Vahdat没有展示一枚芯片,而是拿出了两枚——TPU 8t与TPU 8i。这不是简单的产品迭代,而是一场深刻的战略转向:谷歌首次将TPU家族明确“分家”,一枚专攻训练,一枚专注推理。这一举动,标志着AI算力发展从“粗放式全能”迈向“精细化分工”的新阶段。

训练与推理:从“一芯两用”到“术业专攻”

过去,AI芯片往往兼顾训练与推理,像一把瑞士军刀,什么都能干,但未必样样精通。训练如同“学霸啃书”,需要极致算力与海量内存,目标是锤炼出强大的模型;而推理则像“学霸上岗”,面对的是高频、低延迟、低成本的实时响应需求。

在AI早期,模型规模较小、应用场景有限,统一架构尚可应付。但随着Agentic AI(智能体AI)的崛起,推理负载呈指数级增长。一个AI智能体完成一项任务,可能需要调用数十次模型推理,事务量是普通聊天机器人的20到50倍。此时,若仍用昂贵的训练芯片跑推理,无异于“用洲际导弹送外卖”——性能过剩,成本失控。

谷歌正是看准了这一痛点,果断将芯片“一分为二”。TPU 8t专攻训练,追求极致算力与扩展性;TPU 8i则聚焦推理,目标是“又快又省”。

TPU 8i:为Agent时代量身打造的“推理暴君”

TPU 8i的设计哲学,是“精准打击”推理场景的核心瓶颈。

首先,它大幅强化了“短期记忆”——片上SRAM扩容3倍。这意味着芯片能更快访问关键数据,减少频繁读取外部内存带来的延迟与能耗。配合288GB的HBM高带宽内存,TPU 8i在处理复杂、多步推理任务时,几乎不会“卡顿”,堪称专为Agent设计的“思维加速器”。

更关键的是能效比。TPU 8i的能效较上一代提升117%,意味着在相同电力成本下,可支撑近双倍的推理服务。在数据中心电力日益成为瓶颈的今天,这一提升直接转化为商业竞争力。谷歌云人工智能与计算基础架构副总裁Mark Lohmeyer直言:“关键在于以最低的单次交易成本实现最低延迟。交易量在飙升,成本必须大幅下降,才能实现规模化。”

为什么是现在?Agentic AI引爆推理需求

谷歌的“分家”策略,背后是AI产业的结构性转变。过去两年,硅谷的风向已从“大模型狂热”转向“智能体热”。AI不再只是聊天工具,而是能自主接任务、调用工具、持续工作的“数字员工”。

据Gartner预测,到2026年底,40%的企业应用将嵌入特定任务的AI Agent。麦肯锡则估计,到2030年,Agentic AI带来的商业机会高达3万亿至5万亿美元。然而,技术再先进,若推理成本居高不下,商业化落地便无从谈起。

这正是谷歌TPU 8i的“偷家”逻辑:不打最贵的仗(不盲目比拼训练算力),只割最肥的肉(抢占高增长、高价值的推理市场)。它不正面硬刚英伟达的H100、B200,而是从企业最痛的“运营成本”切入,用极致性价比赢得市场。

生态联盟初现:Meta与Anthropic的站队

谷歌的预判,正被市场用真金白银验证。Meta与Anthropic已成为TPU v8系列的首批客户。Anthropic确认其下一代模型已在TPU 8t集群上运行数月,并计划持续合作;Meta则可能将TPU 8i用于其大规模推理服务,以降低运营成本。

这不仅是技术选择,更是生态站队。随着AI进入“分工时代”,算力供应商的角色也在分化:有人做“重装备”,有人做“轻骑兵”。谷歌显然押注后者——用专业化芯片,服务专业化场景。

未来,AI算力或将像现代工厂的流水线,训练与推理各司其职,高效协同。而TPU 8i,正是这场变革的先锋。

标签: AI芯片 TPU 8i Agentic AI 谷歌云 推理优化

相关文章

智象未来打造原生全模态世界模型

从多模态到世界模型:智象未来的AI进化之路 在人工智能技术快速迭代的当下,生成式AI正从单一模态的“工具型”应用,迈向融合视觉、听觉、语言乃至物理逻辑的“认知型”系统。近日,国内多模态生成式AI企业智...

谷歌Gemini Robotics-ER 1.6重塑工业机器人认知能力

从“看见”到“看懂”:谷歌新一代机器人模型如何重塑工业场景 当波士顿动力的机器狗Spot在工厂中缓步前行,精准地停在压力表前,读取指针刻度并准确报出数值时,这不再是一场炫技的演示,而是机器人认知能力的...

广汽2026科技日发布星灵架构4.0

从底层重构智能出行:广汽2026科技日的硬核突破 当智能汽车竞争进入深水区,真正的较量早已不是单一功能的堆砌,而是底层架构与核心技术的系统性突破。4月12日,2026广汽科技日在番禺总部拉开帷幕,以“...

AI自主玩手机!ClawGUI打通训练评测部署全流程

当AI开始“玩手机”:从消消乐到真机操控的跨越 你见过AI自己玩消消乐吗?没有脚本、没有人工干预,它只是静静地看着屏幕,识别图案、规划路径、点击消除——整个过程流畅得如同一个熟练的玩家。更令人惊讶的是...

22岁开发者逆推Claude Mythos架构

当“堆参数”遇上“循环思考”:22岁开发者逆推Claude Mythos架构 在AI大模型领域,“更大即更好”曾是颠扑不破的真理。千亿参数、万亿参数……模型规模一路狂飙,算力成本也随之水涨船高。然而,...

上海发力新一代通用人工智能技术突破

上海加速布局人工智能新赛道:从技术攻关到产业落地的全面突围 在数字经济浪潮席卷全球的当下,人工智能已成为城市竞争的核心引擎。近日,上海市人民政府办公厅正式印发《国家数字经济创新发展试验区(上海)实施方...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。