NIST:中国顶级 AI 模型落后
Fazen Markets Editorial Desk
Collective editorial team · methodology
Vortex HFT — Free Expert Advisor
Trades XAUUSD 24/5 on autopilot. Verified Myfxbook performance. Free forever.
Risk warning: CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. The majority of retail investor accounts lose money when trading CFDs. Vortex HFT is informational software — not investment advice. Past performance does not guarantee future results.
2026年5月4日,一篇引用美国国家标准与技术研究院(NIST)“协作人工智能安全倡议”(CAISI)的 Decrypt 报道称,中国领先的大型语言模型,包括 DeepSeek V4 Pro,在所使用的基准套件中表现不佳。根据 Decrypt 的报道,CAISI 采用了私有基准和一个成本比较筛选,这一筛选排除了除 GPT-5.4 mini 之外的所有美国模型——在某些分析中有效地将竞争的美方系统从直接比较中剔除(Decrypt,2026-05-04)。该公告立即引发独立研究人员的质疑,他们指出未公开的测试集和使用成本筛选的决定可能导致偏差。对于跟踪 AI 基础设施和平台竞争的机构投资者而言,这份报告提出了关于公共基准透明性、基于专有测试评估模型可比性以及对云计算和半导体需求短期影响的问题。本文阐述背景、量化迄今披露的数据点、评估对 MSFT 和 NVDA 等供应商的行业影响,并提供 Fazen Markets 视角,说明机构投资者接下来应关注的要点。
Context
Decrypt 报道中的 CAISI 披露是少见的案例——一个与美国政府相关的测试项目公开比较了一个有明确名称的中国模型(DeepSeek V4 Pro)与若干西方系统。NIST 的 CAISI 负责制定 AI 安全与性能的标准和评估,但其以往公开报告曾强调透明性与开放基准。2026 年 5 月 4 日的披露偏离了这一做法,纳入了私有基准并采用了一个明确的成本比较筛选,据 Decrypt 报道,该筛选排除了除 GPT-5.4 mini 外的所有美国模型。该决定实质上改变了比较集,并影响了对跨境模型同等性的推断。
历来,公开的模型比较使用开放数据集以便于可复现性:例如学术排行榜以及 2023–2025 年间类似 NIST 的开放可复现性努力。Decrypt 中描述的 CAISI 方法打破了这一模式,引入了一个评估层——成本筛选——其动因偏向经济考量而非纯粹性能驱动。结果是技术信息与政策信息并存:技术上声称中国模型落后;政治上隐含了关于成本与可部署性的信号。这两方面对评估许可、云计算需求和供应商竞争定位的市场参与者都很重要。
时机值得注意。2024–2026 年的 AI 投资周期已被模型性能里程碑及围绕数据访问与半导体出口的地缘政治摩擦所塑造。一个政府相关的评估若声明中国模型落后,可能会强化有利于西方云服务提供商和芯片制造商的叙事。然而,该叙事的可信度取决于方法学的透明度。Decrypt 引述的独立专家呼吁谨慎,称私有基准和成本筛选使结论不那么确定(Decrypt,2026-05-04)。
Data Deep Dive
到目前为止公开报告的具体数据点有限但明确。Decrypt 引述称 CAISI 使用私有基准和成本比较筛选对 DeepSeek V4 Pro 进行了评估,该筛选排除了除 GPT-5.4 mini 之外的所有美国模型。这实际上相当于将所有美方模型完全剔除仅保留一个,这一统计数字实质性地影响了比较结果。Decrypt 报道日期为 2026 年 5 月 4 日,文章将这些方法学选择归因于 CAISI;就目前而言,Decrypt 是这些主张的主要公开来源。
除了该头条之外,报告未提供已发布的分数表或可供独立验证的测试输入。批评者指出缺乏开放排行榜或可复现的评估工件。对量化型投资者而言,这种不可复现性增加了与任何以竞争动态转变为交易论点相关的模型风险。没有底层指标的访问,就无法计算效应量、置信区间,或判断差异在经济上是否有意义还是统计上微不足道。
投资者应将其他行业数据点与 CAISI 披露叠加分析。英伟达(Nvidia)在 2025 财年数据中心 GPU 收入同比增长 60%(公司文件),反映了培训与推理需求的持续旺盛。主要云服务提供商——尤其是微软 Azure 与 Google Cloud——在 2025 年的季度财报中报告 AI 服务收入实现中高两位数的同比增长。这些现实世界指标表明,即便某类模型在一次私有测试中被判定落后,计算与部署市场依然强劲。因此,投资者须区分单次评估叙事与对计算消耗或许可流动产生的持久性变化。
Sector Implications
如果 CAISI 的解读——即 DeepSeek V4 Pro 和类似的中国模型落后于领先的西方模型——在开放、可复现的基准上得到验证,短期受益者很可能包括西方云服务商和半导体生态系统。美国模型市场份额的提升将增加对高性能推理实例的需求,提升云收入构成并带动更高利润率的 AI 工作负载。鉴于其在模型托管与训练硬件方面的核心地位,受此情形影响较大的票据包括 MSFT 与 NVDA。然而,Decrypt 的报道并未提供足够证据将此视为已确认的配置变化。
对中国云服务商和 AI 平台公司而言,CAISI 声明的公关效应可能是复杂的。一方面,一项广泛报道的政府声明可能在短期内对中国模型提供商的投资者情绪造成压制。另一方面
Trade XAUUSD on autopilot — free Expert Advisor
Vortex HFT is our free MT4/MT5 Expert Advisor. Verified Myfxbook performance. No subscription. No fees. Trades 24/5.
Position yourself for the macro moves discussed above
Start TradingSponsored
Ready to trade the markets?
Open a demo account in 30 seconds. No deposit required.
CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. You should consider whether you understand how CFDs work and whether you can afford to take the high risk of losing your money.