谷歌发布高内存TPU用于AI训练
Fazen Markets Research
Expert Analysis
导语:
在2026年4月22日,谷歌宣布了两款为特定用途设计的硅片——一款用于训练的TPU和一款用于推理的TPU,公司表示这两款芯片在封装内集成了大量片上静态RAM(SRAM),以减少大型语言模型和其他生成式AI工作负载的内存瓶颈(CNBC,2026年4月22日)。此举代表了谷歌多年内部化关键AI基础设施并在Google Cloud中提供差异化性能战略的一次直接升级。行业跟踪数据显示,外部供应商中英伟达仍为数据中心加速器的主导者;业界估计英伟达在2025年AI GPU部署中的份额约为75–85%(行业估计)。因此,谷歌的新芯片既体现了内部优化——减少对第三方加速器的依赖——也对超大规模云服务商的采购动态施加了新的压力。
背景
谷歌于2026年4月22日的宣布,延续了自2016年首款TPU问世以来十年的TPU开发历程,后续多代产品均针对加速神经网络中核心的矩阵乘法运算进行了优化。在此期间,竞争格局从通用CPU转向专业加速器:GPU、定制ASIC和FPGA。外部供应商,主要是英伟达,构建了既有的市场份额和软件生态系统,包括库、编译器和开发者熟悉度——这是一种结构性优势,阻碍了其被迅速取代的可能性。
云厂商的市场份额为该背景提供了参考。Synergy Research Group及类似行业调查的数据表明,2025年AWS仍保持最大云基础设施份额,约占全球支出33%,微软Azure约22%,Google Cloud约10%(Synergy Research Group,2025)。这些分布意味着,谷歌的TPU战略部署首先直接影响的是Google Cloud的成本与性能表现,而非立即显著改变第三方加速器的更广泛市场。
从采购与资本支出角度看,超大规模云服务商愈发倾向于纵向整合以降低成本并调校性能。亚马逊的Graviton/Trainium系列和Meta的OpenBMC/AI硅片计划是类似的内制化尝试。谷歌的新宣布应被视为这一趋势的下一步——押注通过定制硅片并在封装中集成更多SRAM,可以为客户所需规模的模型带来可度量的总拥有成本(TCO)和延迟改进。
数据深度解析
CNBC于2026年4月22日的报道确认了两款不同的芯片:一款针对大规模训练工作负载进行了调优,另一款为推理场景优化(CNBC,2026年4月22日)。谷歌强调封装上静态RAM的数量作为核心差异点;SRAM可以减少在片外DRAM与计算阵列之间传输张量时的延迟和能耗惩罚。该设计选择表明,谷歌试图将性能瓶颈从外部内存带宽转移到持续的片上计算利用率,这一权衡会增加每颗芯片的硅面积,但在受限的数据中心环境下可能带来更高的每瓦有效吞吐量。
相比之下,现行的外部市场领导者英伟达则构建了围绕高性能GPU与大型高带宽内存(HBM)堆栈以及广泛软件层(如CUDA、cuDNN和一系列优化框架)的商业模式。行业估计显示,2025年英伟达在数据中心AI加速器部署中的份额约为75–85%(行业估计)。这种规模带来了两个优势:一是广泛的软件优化基础,二是为企业和研究机构提供的经验证训练与推理方案的深度二级市场,这些都使得采纳替代平台需要付出额外工程成本。
另一个相关数据点是前述云市场份额分布:在Google Cloud约占10%基础设施支出、而AWS占33%、Azure占22%(Synergy Research Group,2025)的背景下,任何谷歌硅片的成功首先会在谷歌自身的数据中心体现为单位经济性的改善。即便谷歌成功将Google Cloud内部工作负载从英伟达加速器迁移出去,最初亦主要体现在谷歌自身采购线上的第三方购买减少,而非对整个超大规模云服务商群体中英伟达销量的系统性、即时下滑。
行业影响
对于数据中心厂商和超大规模云服务商的采购团队而言,谷歌的芯片将增加供应商竞争的新维度。如果TPU设计在真实工作负载中兑现了承诺的延迟与吞吐量改进,Google Cloud便能向战略客户宣传更低的推理成本和差异化的服务等级协议(SLA)。随着时间推移,这可能对英伟达在那些谷歌栈可直接替代的工作负载上造成利润压力。然而,取代的前提是生态系统的可移植性:企业既重视原始性能,也重视广泛的软件兼容性。
对英伟达而言,短期影响可能有限:英伟达的总体可寻址市场(TAM)并非一个会被完全放弃的零和篮子。英伟达的产品周期、软件护城河与既有装机基础带来粘性;许多企业AI流水线已针对CUDA和英伟达生态进行了深度优化。更大的考验在于谷歌是否会以允许第三方采用的方式开放其TPU设计,还是将其保持为专有,仅惠及Google Cloud。若采取专有发布,主要受影响的将是谷歌及其在Google Cloud上运行的客户的第三方支出。
供应链参与方应关注晶圆代工与封装方面的需求。封装上更高密度的SRAM意味着晶粒级(die)经济性发生变化,并可能增加对先进封装合作伙伴和专用存储IP许可的需求。如果谷歌走向与亚马逊和苹果类似的内部规模化路线,设备供应商如ASML及先进封装厂可能看到额外业务范围,尽管这一结果取决于谷歌尚未披露的生产量承诺。
风险评估
采用风险是 materia
Position yourself for the macro moves discussed above
Start TradingSponsored
Ready to trade the markets?
Open a demo account in 30 seconds. No deposit required.
CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. You should consider whether you understand how CFDs work and whether you can afford to take the high risk of losing your money.