CoreWeave以DeepSeek-V3训练打破MLPerf记录
Fazen Markets Editorial Desk
Collective editorial team · methodology
Vortex HFT — Free Expert Advisor
Trades XAUUSD 24/5 on autopilot. Verified Myfxbook performance. Free forever.
Risk warning: CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. The majority of retail investor accounts lose money when trading CFDs. Vortex HFT is informational software — not investment advice. Past performance does not guarantee future results.
专注于云计算的提供商 CoreWeave 在行业标准的MLPerf基准测试中实现了训练DeepSeek-V3大型语言模型的最快记录时间,Investing.com于2026年6月16日报道。该公司在11.2分钟内完成了基准训练,创造了新的性能记录。这一结果出现在AI基础设施供应商之间竞争基准测试加剧的背景下,并且在2026年5月CoreWeave获得了创纪录的85亿美元投资后发布。
背景 — 为什么现在重要
自2018年成立以来,MLPerf联盟已成为证明AI硬件和软件堆栈性能的权威舞台。CoreWeave的胜利是在其他超大规模和专业供应商一系列创纪录的测试之后发生的。2025年4月,谷歌的TPU v5平台在类似基准测试中创下了16.5分钟的记录。当前AI基础设施的宏观环境特征是资本支出激增。10年期国债收益率为4.31%,影响着支撑这一竞争的数据中心建设的资本成本。
多个因素汇聚触发了这一特定事件。DeepSeek-V3模型架构的发布为基准测试提供了一个全新且苛刻的标准。同时,CoreWeave获得了85亿美元的巨额资金注入,使其能够部署和优化最新一代的NVIDIA硬件,特别是H200平台。这一资本优势直接转化为扩大其集群规模和优化其软件堆栈的能力,以便在2026年6月的提交窗口中展示其资金的实际回报。
催化链条非常简单。巨额投资使得采购尖端硬件成为可能。这些硬件结合专有软件优化,在公认的行业测试中产生可衡量的性能领先。这一领先随后被宣传给企业客户和开发者,作为卓越效率的证明,直接影响客户获取和市场份额,在一个性能转化为更低训练成本和更快迭代周期的行业中尤为重要。
数据 — 数字显示了什么
CoreWeave的提交显示DeepSeek-V3模型的训练时间为11.2分钟。这比14个月前创下的16.5分钟的先前记录提高了32%。基准测试运行使用了4096个NVIDIA H200 GPU。该性能转化为持续的总计算吞吐量超过65 exaflops。
下表对比了CoreWeave的最新结果与一项关键的先前提交:
| 指标 | CoreWeave (2026年6月) | 谷歌TPU v5 (2025年4月) | 变化 |
|---|---|---|---|
| 训练时间 | 11.2分钟 | 16.5分钟 | -32% |
| 硬件 | 4096个NVIDIA H200 | 未披露的TPU v5 Pod | N/A |
| 模型 | DeepSeek-V3 | 可比的LLM | N/A |
这一性能提升显著超越了更广泛市场的效率改进。标准普尔500信息技术指数年初至今上涨了12%,反映出普遍的乐观情绪,但CoreWeave的32%基准跃升则是一个独特、超常的技术进步。该结果还强调了尽管来自定制硅替代品的竞争上升,NVIDIA的GPU架构在原始性能基准中的持续主导地位。
分析 — 对市场/行业/股票的意义
第二阶效应将在多个行业中显现。直接受益者包括NVIDIA (NVDA),因为创纪录的结果巩固了对其旗舰H200和Blackwell GPU的需求。CoreWeave的私人市场估值,最后被评估为550亿美元,将面临上行压力,积极影响其投资者以及专注于AI基础设施的私募股权行业。依赖大规模AI模型训练的公司,如OpenAI、Anthropic和特斯拉 (TSLA) 的自动驾驶模型,将受益于更低的成本和更快的发展周期,可能加速自身的产品路线图。
相反,这一结果对超大规模云服务提供商如亚马逊网络服务 (AMZN)、微软Azure (MSFT) 和谷歌云 (GOOGL) 提出了挑战。尽管它们在集成服务套件上竞争,但核心训练工作负载中的纯性能差距可能会影响对成本敏感的企业AI项目。半导体行业的影响则是混合的;尽管NVIDIA受益,但竞争对手如AMD (AMD) 和英特尔 (INTC) 必须在未来基准测试中展示可比或更优的性能,以保持在AI加速器领域的可信度。
这一分析的一个关键限制是,MLPerf基准测试测量的是在受控工作负载下的峰值性能,而不一定是多个月训练活动中的实际、持续成本效率。网络瓶颈、软件可靠性和实际功耗是未在11.2分钟的标题数字中充分反映的关键因素。定位数据显示,机构资金流向AI基础设施层。对冲基金越来越多地看好NVIDIA,并探索CoreWeave的IPO前二级市场头寸,而在被认为不够灵活的传统数据中心REIT中的空头兴趣上升。
前景 — 接下来需要关注什么
市场参与者应关注几个即将到来的催化剂。NVIDIA在2026年8月20日的第二季度财报将提供对H200和Blackwell推出速度及大型云服务提供商需求信号的洞察。2026年9月的下一个MLPerf提交窗口将揭示竞争对手是否缩小了性能差距。传闻中的CoreWeave首次公开募股,预计将在2027年上半年进行,将成为私募投资者的重要流动性事件,并为该行业提供新的公开比较。
需要关注的关键技术水平包括NVIDIA的股价相对于其50日移动平均线的表现,突破这一水平可能会发出情绪转变的信号。在债券市场,关注iShares半导体ETF (SOXX) 的收益率,以寻找对资本密集型芯片行业风险偏好变化的迹象。监测公共云公司的估值倍数与其来自AI服务的收入增长,将表明市场是否在定价持续的基础设施优势或更商品化的结果。
常见问题解答
MLPerf训练速度如何影响AI开发成本?
更快的训练时间直接降低了AI开发中最大的可变成本:云计算费用。CoreWeave展示的32%的速度提升,可以转化为训练前沿模型的成本相应降低,这通常高达数千万美元。这一效率提升使研究团队能够更快地进行迭代,在固定预算内测试更多的模型架构和数据集。它还降低了小型公司开发竞争模型的进入门槛,可能会增加AI应用层的创新和竞争。
CoreWeave使用NVIDIA H200 GPU的意义是什么?
使用NVIDIA H200 GPU使CoreWeave能够利用最新的硬件性能优势,从而在竞争中取得领先地位,进一步推动AI基础设施的发展。
Trade XAUUSD on autopilot — free Expert Advisor
Vortex HFT is our free MT4/MT5 Expert Advisor. Verified Myfxbook performance. No subscription. No fees. Trades 24/5.
Position yourself for the macro moves discussed above
Start TradingSponsored
Ready to trade the markets?
Open a demo account in 30 seconds. No deposit required.
CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. You should consider whether you understand how CFDs work and whether you can afford to take the high risk of losing your money.