SambaNova以35亿美元云计算项目降低AI推理成本
Fazen Markets Editorial Desk
Collective editorial team · methodology
Vortex HFT — Free Expert Advisor
Trades XAUUSD 24/5 on autopilot. Verified Myfxbook performance. Free forever.
Risk warning: CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. The majority of retail investor accounts lose money when trading CFDs. Vortex HFT is informational software — not investment advice. Past performance does not guarantee future results.
Rodrigo Liang,AI芯片公司桑巴诺瓦系统(SambaNova Systems)的首席执行官表示,模型推理是企业人工智能面临的主要成本挑战。他在2026年6月3日发表的彭博社《开放兴趣》采访中表示,这与新推出的由Vista Equity Partners和Cambium Capital支持的35亿美元AI云项目的发布相吻合。Liang认为,结合GPU、CPU和专用处理器的解耦架构可以显著降低费用,并加速大型企业的AI代理部署。
背景 — 为什么现在重要
企业AI支出已经超过了模型训练的基础设施成本。Forrester Research在2026年4月估计,推理现在占据了生产AI模型总生命周期成本的70%以上。宏观背景是资本成本持续高企,10年期国债收益率徘徊在4.5%左右,给企业的新技术投资回报计算带来压力。
催化剂是大型语言模型应用的快速扩展,从试点阶段到全面部署。这一转变暴露了仅依靠Nvidia的高端GPU集群进行推理的高昂经济成本。对复杂模型的单次查询可能花费几美元,使得广泛使用代理在经济上不可行。这一成本障碍促使人们寻找更高效的计算架构,超越同质GPU数据中心。
数据 — 数字显示了什么
新的AI云倡议获得了来自私募股权公司Vista Equity Partners和Cambium Capital的35亿美元资金。桑巴诺瓦的内部基准测试表明,其解耦系统能够将特定企业工作负载(如检索增强生成)的推理成本降低70%至90%。
| 架构 | 每百万个标记的估计成本 | 性能目标 |
|---|---|---|
| 同质GPU云 | $12 - $18 | 基线延迟 |
| 桑巴诺瓦解耦 | $2 - $5 | 可比延迟 |
这与主要提供商的现行云推理定价相比,后者的成本可能超过每百万个输出标记15美元。根据Gartner在2026年第一季度的预测,企业AI推理的可寻址市场预计将从2025年的400亿美元增长到2030年的1500亿美元以上。Nvidia的数据中心收入(AI硬件需求的一个代理)在其上一个财政季度达到了创纪录的428亿美元。
分析 — 对市场/行业/股票的影响
直接受益者是那些有重度AI集成路线图的企业软件公司,如Salesforce (CRM) 和 ServiceNow (NOW),它们可能会看到云运营费用的降低。专注于替代AI处理器的半导体公司,如AMD (AMD) 和 Intel (INTC),可能会随着市场向多元化架构的转变而获得市场份额。如果解耦产品削弱了它们的高端GPU服务定价,超大规模云服务提供商可能面临潜在的利润压力。
一个主要的限制是供应商锁定和软件兼容性。桑巴诺瓦的架构需要优化的软件堆栈,这为那些基于CUDA生态系统的企业创造了迁移摩擦。主要的反对论点是,Nvidia不断的创新步伐(例如其最近宣布的Blackwell平台)将保持其成本-性能领导地位和生态优势。
来自期权市场的数据表明,半导体ETF(如SMH)的看跌期权购买增加,这表明一些投资者正在对纯GPU需求增长放缓进行对冲。风险投资和私募股权资金流入专注于效率的AI基础设施初创公司,年初至今在该领域投资超过120亿美元。
展望 — 接下来要关注什么
下一个主要催化剂是Nvidia在2026年8月21日的下一个财报,届时将密切关注推理收入构成和竞争威胁的评论。2026年11月的超级计算大会(SC26)将展示新解耦系统与旗舰GPU集群的对比性能基准。
需要关注的关键水平包括微软Azure、谷歌云平台和亚马逊网络服务在其2026年第三季度报告中的云部门收入增长率。如果年同比增长率降至20%以下,可能会表明企业削减成本影响到现有提供商。监测全球X人工智能与技术ETF(AIQ)的股价相对于PHLX半导体指数(SOX)的表现;持续的背离将表明AI供应链内的市场轮换。
常见问题解答
SambaNova的公告对Nvidia股票意味着什么?
这引入了一个在高利润推理市场中的可信长期竞争者,而推理市场正占据Nvidia数据中心收入的越来越大部分。尽管Nvidia的生态系统和训练优势仍然存在,但投资者的关注将转向其捍卫推理市场份额的能力。分析师将关注未来财报中与推理平均售价相关的任何指导调整。
解耦AI计算与传统云AI有何不同?
传统云AI在所有任务中严重依赖于大型同质GPU集群。解耦架构使用混合硬件——GPU用于并行计算,CPU用于逻辑,专用AI处理器用于效率——由软件协调。这将AI工作负载的每个部分匹配到最具成本效益的硬件,类似于现代数据中心使用不同存储层(SSD、HDD、磁带)的方式。
这与从大型机到客户端-服务器计算的过渡相似吗?
这一类比在于去中心化计算能力和针对特定任务的优化。大型机时代(同质、集中计算)让位于客户端-服务器模型(解耦、适当规模计算)。同样,AI行业最初对大型同质GPU集群的依赖可能会演变为针对训练和不同类型推理量身定制的异构系统,从而降低总体拥有成本。
结论
桑巴诺瓦的35亿美元投资表明,AI推理成本,而非模型能力,是企业采用的下一个决定性战场。
免责声明:本文仅供信息参考,不构成投资建议。CFD交易具有高风险的资本损失。
Trade XAUUSD on autopilot — free Expert Advisor
Vortex HFT is our free MT4/MT5 Expert Advisor. Verified Myfxbook performance. No subscription. No fees. Trades 24/5.
Position yourself for the macro moves discussed above
Start TradingSponsored
Ready to trade the markets?
Open a demo account in 30 seconds. No deposit required.
CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. You should consider whether you understand how CFDs work and whether you can afford to take the high risk of losing your money.