人工智能芯片制造商面临内存瓶颈,处理速度翻倍
Fazen Markets Editorial Desk
Collective editorial team · methodology
Vortex HFT — Free Expert Advisor
Trades XAUUSD 24/5 on autopilot. Verified Myfxbook performance. Free forever.
Risk warning: CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. The majority of retail investor accounts lose money when trading CFDs. Vortex HFT is informational software — not investment advice. Past performance does not guarantee future results.
先进的人工智能模型训练现在面临一个关键的不平衡,处理速度的增长显著超越了内存带宽的能力。这一结构性瓶颈在2026年6月13日的报告中被指出,导致高带宽内存生产商在未来财政年度的资本支出计划增加超过40%,因为行业急于跟上每六个月翻倍的计算需求。这个不断扩大的差距威胁到下一代人工智能系统的性能,除非新的内存架构能够大规模部署。
背景 — [为什么内存现在是瓶颈]
当前的限制被称为内存墙,在计算发展的历史中有先例。上一次显著的CPU与内存之间的差距发生在2000年代初,当时处理器频率超过3 GHz,而内存总线速度停滞在800 MHz以下,这一差距需要多级缓存创新来克服。今天,专为人工智能设计的计算单元,如Nvidia的H100 GPU,自2020年以来将模型训练时间缩短了30倍,但同一时期内存带宽仅增加了8倍。直接催化剂是行业普遍转向万亿参数模型,这需要将整个数据集保存在活动内存中以进行实时推断,这一需求耗尽了当前的内存子系统设计。这一切发生在对人工智能基础设施持续高资本投资的宏观背景下,Phlx半导体行业指数年初至今上涨了22%。
数据 — [数字显示了什么]
具体数据说明了这种不平衡的严重性。Nvidia最新的Blackwell GPU架构提供20 petaflops的计算能力,比其前身增加了100%,但其内存带宽峰值为每秒8 terabytes,仅增加50%。高带宽内存模块的价格在2026年上半年上涨了40%,远超标准DRAM的5%增长。领先的HBM供应商SK Hynix报告称,HBM收入同比增长120%,现在占其总内存销售的35%。作为比较,24GB HBM3e堆叠的现货价格达到了$350,而标准DDR5内存模块的32GB交易价格为$45。下表显示了领先人工智能芯片的带宽差距演变。
| 芯片 | 发布日期 | 计算能力 (PF) | 内存带宽 (TB/s) | 带宽/计算比率 |
|---|---|---|---|---|
| A100 | 2020 | 0.6 | 2.0 | 3.33 |
| H100 | 2022 | 4.0 | 3.4 | 0.85 |
| B200 | 2026 | 20.0 | 8.0 | 0.40 |
分析 — [这对市场/行业/股票意味着什么]
这一瓶颈在半导体生态系统中创造了明显的赢家和输家。主要受益者是HBM制造商SK Hynix(000660.KS)、三星(005930.KS)和美光(MU),其先进的封装能力现在成为了关键的竞争护城河。分析师预计对其2027年盈利预期将上调15-20%。芯片设计师如Nvidia(NVDA)和AMD(AMD)面临利润压力,因为HBM成本在其总系统成本中占比越来越大,如果无法将成本转嫁给超大规模客户,可能会压缩毛利率200-300个基点。反对论点认为,软件优化和新的模型压缩技术可能部分缓解硬件不足,正如Meta最近的Llama 4模型所示,该模型将内存使用减少了30%。机构流动数据显示,VanEck半导体ETF(SMH)的多头头寸增加,大型资产管理公司直接增持HBM供应商的股票。
前景 — [接下来要关注什么]
近期的关键催化剂是SK Hynix在2026年7月25日的财报电话会议,关于2027年HBM生产能力的指引将表明行业应对短缺的能力。IEEE国际内存研讨会将于8月12日举行,展示下一代原型,如Hybrid Memory Cube 2.0,承诺带宽增加60%。市场参与者应监测目前为15%溢价的HBM现货-期货价差,以寻找收紧实物供应的迹象。HBM3e现货价格持续突破$400水平将确认供应链压力加剧。Nvidia在其2027年Blackwell Ultra架构中集成封装内存的成功将是架构解决方案的重要指标。
常见问题
什么是人工智能内存墙?
人工智能内存墙是处理器计算速度与其从内存中快速检索数据的能力之间日益扩大的性能差距。随着人工智能芯片每六个月处理能力翻倍,其内存子系统无法以相同的速度扩展,导致处理器在等待数据时处于闲置状态。这延缓了训练时间,并增加了云服务提供商和研究机构的人工智能运营总成本。
高带宽内存(HBM)如何解决这个问题?
高带宽内存通过垂直堆叠DRAM芯片,并通过一种称为硅中介的超宽接口将它们连接到处理器。这创造了更短的数据路径,并允许与传统平面内存模块相比显著更多的同时数据传输。当前HBM3e标准提供超过6 TB/s的带宽,但即便如此,对于需要10-12 TB/s的下一代人工智能加速器来说仍然不足。
哪些上市公司受到内存瓶颈的影响最大?
这一瓶颈直接使三家能够大规模生产HBM的公司受益:SK Hynix、三星和美光。它对像Nvidia和AMD这样的人工智能芯片设计师构成挑战,他们必须管理不断上升的组件成本。它还影响了微软Azure和谷歌云等主要人工智能基础设施买家,因为较慢的训练时间增加了他们的运营费用和硬件资本支出。
结论
内存瓶颈现在是人工智能可扩展性的主要工程限制。
免责声明:本文仅供信息参考,不构成投资建议。CFD交易存在高资本损失风险。
Trade XAUUSD on autopilot — free Expert Advisor
Vortex HFT is our free MT4/MT5 Expert Advisor. Verified Myfxbook performance. No subscription. No fees. Trades 24/5.
Position yourself for the macro moves discussed above
Start TradingSponsored
Ready to trade the markets?
Open a demo account in 30 seconds. No deposit required.
CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. You should consider whether you understand how CFDs work and whether you can afford to take the high risk of losing your money.