模型路由的普及对OpenAI和Anthropic构成100亿美元威胁
Fazen Markets Editorial Desk
Collective editorial team · methodology
Vortex HFT — Free Expert Advisor
Trades XAUUSD 24/5 on autopilot. Verified Myfxbook performance. Free forever.
Risk warning: CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. The majority of retail investor accounts lose money when trading CFDs. Vortex HFT is informational software — not investment advice. Past performance does not guarantee future results.
公司们正在系统性地将AI工作负载从昂贵的通用模型转向更便宜的专业替代方案,这是一种被称为模型路由的节省成本策略。这一趋势在2026年中期加速,直接对OpenAI和Anthropic等领先AI公司的高端定价施加压力,这些公司在其旗舰模型的高使用量上建立了收入模型。这一迁移可能会危及这些公司预计的数十亿美元的年度经常性收入,因为企业客户在其AI部署中优先考虑效率而非品牌认知。
背景 — 为什么模型路由现在很重要
模型路由在2025年底获得了关注,因为大型、昂贵模型在日常任务中的边际效用未能证明其成本合理。这一做法类似于云计算中的历史先例,企业在2010年至2020年间从依赖单一提供商演变为多云策略,以优化性能和成本。目前的AI成本危机源于模型推理费用占用IT预算的不可持续部分,一些公司报告称,AI运营成本同比翻了一番。
广泛采用的催化剂是模型生态系统的成熟。来自Mistral AI和谷歌的Gemma等提供商的高性能开源模型和专业API的激增,现在在特定功能(如代码生成或摘要)上提供与市场领导者相当的质量,成本却低得多。同时,中间件公司开发了复杂的路由引擎,可以根据复杂性、延迟要求和成本参数智能地分配任务。这一技术成熟与2026年初CFO对AI投资回报率的高度关注相结合。
数据 — 数字显示了什么
模型路由的早期采用者报告称,在大多数商业应用中,AI推理成本降低了40%到80%,而输出质量没有显著下降。一家金融服务公司记录到,通过实施一个路由层,该公司将70%的查询转向低成本模型,从而将每月的AI支出从850,000美元减少到210,000美元。作为对比,OpenAI的GPT-4和Anthropic的Claude 3 Opus的企业合同在重度使用情况下每年可超过500万美元,而许多任务的可比性能可以通过每年成本低于500,000美元的模型实现。
| 工作负载类型 | 高端模型每次查询成本 | 路由模型每次查询成本 | 节省百分比 |
|---|---|---|---|
| 文本摘要 | $0.12 | $0.03 | 75% |
| 代码生成 | $0.15 | $0.05 | 67% |
| 客户支持 | $0.10 | $0.02 | 80% |
生成AI软件的可寻址市场预计到2028年将达到1500亿美元。OpenAI和Anthropic合计代表超过100亿美元的年化收入,这一数字在很大程度上依赖于高端模型的使用。分析师估计,如果模型路由占据30%的企业市场,可能会在未来24个月内从领先模型提供商的收入增长预测中消除30亿到40亿美元。
分析 — 这对市场和行业意味着什么
向模型路由的转变在AI价值链中创造了明显的赢家和输家。基础设施和中间件公司如DataDog (DDOG)、MongoDB (MDB)以及LangChain和LlamaIndex等初创公司将受益,因为它们提供管理多模型环境的工具。云服务提供商Microsoft Azure (MSFT)、Google Cloud (GOOGL)和Amazon Web Services (AMZN)可能会看到中性到积极的影响,因为路由层通常仍在其生态系统内运行,并且它们自己也提供一系列专有和开源模型。
这一理论的主要风险在于OpenAI和Anthropic可能通过激进的降价或推出自己的分层模型系列来应对,从而引发价格战,压缩整个行业的利润率。反对论点认为,对于需要最大推理能力的关键任务应用,企业将继续为最先进的模型支付高额费用,从而保留一个有利可图的细分市场。投资者的定位已经反映了这种分歧,资本流入像BOTZ和AIQ这样的AI基础设施ETF,而一些严重依赖昂贵API的上市AI应用公司面临估值下行压力。
前景 — 接下来要关注什么
下一个重要的催化剂是谷歌定于2026年5月举行的I/O开发者大会,在会上有关其Gemini模型系列和在Vertex AI中路由集成的公告将标志着这一超大规模公司的战略。OpenAI的DevDay通常在11月举行,将是其对定价压力的反应及其在纯模型规模之外创新能力的关键指标。微软、亚马逊和Alphabet在2026年7月底的财报电话会议将提供关于企业云AI支出模式和成本优化技术采用率的首个具体数据点。
需要关注的关键水平包括GPT-4.5或Claude 4的每个token定价(如果发布);如果高性能模型的每千token价格跌破0.06美元,则表明防御性定价策略。纯AI基础设施公司的股票表现与应用公司的表现将作为这一趋势的市场晴雨表。C3.ai (AI)等公司的企业估值倍数如果下降超过15%,可能会标志着对依赖昂贵基础模型的AI商业模型的更广泛重新评估。
常见问题解答
什么是人工智能中的模型路由?
模型路由是一种架构策略,其中软件层根据预定义的标准(如成本、速度和所需能力)自动将单个AI任务指向最合适的模型。与其为所有任务使用单一强大的模型,路由系统可能会将简单的文本分类任务发送到快速、便宜的模型,同时将复杂的推理任务保留给更昂贵的高级模型。这种优化最大化了效率,并可以将大多数企业用例的总AI运营费用降低超过50%。
模型路由如何影响较小的AI公司和初创企业?
模型路由降低了初创企业构建AI驱动应用的进入门槛,因为它减少了它们最大的可变成本:模型推理。这使得它们能够更快实现盈利,并更有效地与更大公司竞争。然而,这也增加了竞争,因为多个参与者更容易在类似的技术堆栈上构建。提供独特数据微调、评估框架或特定垂直模型的初创企业在路由生态系统中处于有利位置。
模型路由会减缓OpenAI等公司的AI创新步伐吗?
Trade XAUUSD on autopilot — free Expert Advisor
Vortex HFT is our free MT4/MT5 Expert Advisor. Verified Myfxbook performance. No subscription. No fees. Trades 24/5.
Position yourself for the macro moves discussed above
Start TradingSponsored
Ready to trade the markets?
Open a demo account in 30 seconds. No deposit required.
CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. You should consider whether you understand how CFDs work and whether you can afford to take the high risk of losing your money.