Croissance des tokens IA surévaluée, avertit Anthropic
Fazen Markets Research
Expert Analysis
Paragraphe d'ouverture
La métrique d'usage mise en avant pour les grands modèles linguistiques — le nombre brut de « tokens » traités — est devenue un élément central du récit de croissance de l'IA, mais les données sous-jacentes méritent un examen plus approfondi. CNBC a rapporté le 17 avril 2026 que les volumes de tokens pour les modèles commerciaux ont augmenté d'environ 300–400 % en glissement annuel (CNBC, 17 avr. 2026), une flambée qui, sur le papier, soutient des hypothèses de croissance des revenus pluriannuelle pour les fournisseurs cloud, les fabricants de puces et les opérateurs de modèles. Les déclarations publiques récentes d'Anthropic contrastent avec de nombreuses hypothèses de marché : la société a signalé que les métriques de tokens peuvent être gonflées par le prétraitement, les requêtes synthétiques et le trafic de benchmark interne, et que la croissance réaliste de la demande client est sensiblement inférieure à ce que suggèrent certains chiffres en une ligne (CNBC, 17 avr. 2026). Pour les investisseurs institutionnels, la distinction entre la croissance affichée des tokens et la consommation économiquement pertinente — trafic payant, externe et en production — est cruciale pour les modèles de revenus, les plans d'investissement (capex) et les prévisions de demande en semi‑conducteurs.
Contexte
Le comptage des tokens est séduisant parce qu'il est simple et apparemment objectif : chaque appel d'API ou exécution de modèle consomme des tokens, et leur agrégation produit un taux de croissance facile à diffuser. Pourtant, les modèles diffèrent dans la façon dont les tokens se traduisent en valeur économique. Un échange conversationnel de 1 000 tokens peut représenter un client payant utilisant un flux de travail critique, ou bien un test de développeur, une exécution de benchmark interne, ou une charge de travail synthétiquement générée qui gonfle les volumes agrégés sans se traduire par des revenus durables. La couverture de CNBC du 17 avril 2026 a souligné qu'une large part des augmentations de plusieurs centaines de pourcents observées peut refléter ces catégories non représentatives plutôt que des hausses proportionnelles d'usages monétisables (CNBC, 17 avr. 2026).
Historiquement, le marché est passé des métriques d'usage brutes à des indicateurs monétisables — MAU (utilisateurs actifs mensuels), ARPU (revenu moyen par utilisateur) et rétention de revenus — lorsque les récits se sont révélés trompeurs. Des épisodes comparables incluent les métriques des plateformes sociales dans les années 2010 où les taux d'engagement rapportés cachaient le trafic de bots, et les services cloud à la fin des années 2010 où les essais et tests internes gonflaient l'usage avant conversion. Étant donné que les grands acteurs ont bâti des modèles d'allocation de capital et d'évaluation reposant sur des trajectoires de demande basées sur les tokens, une réévaluation pourrait être déclenchée si des ratios de conversion ou de facturation sensiblement plus faibles sont observés.
Le calendrier est important. La flambée des tokens et la remise en question qui s'ensuit coïncident avec un cycle d'investissement en GPU et en infrastructure cloud. Si la croissance de 300–400 % des tokens est majoritairement non facturable ou éphémère, alors les fabricants de puces et les opérateurs cloud pourraient faire face à un décalage entre l'expansion des capacités et la demande productive. À l'inverse, si une part significative de la hausse se convertit en dépenses SaaS d'entreprise, le cycle d'infrastructure sera soutenu par des facturations réelles. Les 12 prochains mois de métriques de conversion en facturation seront donc décisifs pour les marchés de capitaux.
Analyse des données
Les chiffres spécifiques cités par CNBC fournissent un point de départ : volumes de tokens en hausse estimée de 300–400 % en glissement annuel au 17 avril 2026 (CNBC, 17 avr. 2026). La caractérisation interne d'Anthropic — rapportée par CNBC — suggère que lorsque le trafic synthétique et interne est éliminé, les tokens supplémentaires pilotés par des clients pourraient être inférieurs de 30–60 % aux totaux affichés. Cette fourchette implique un ajustement à la baisse potentiel des prévisions de marché et a des implications immédiates pour la demande projetée en cloud et en GPU.
Comparez ces chiffres de croissance des tokens avec des indicateurs plus larges de la demande de calcul. La croissance des revenus du cloud public pour les principaux fournisseurs (AWS, Azure, GCP) a évolué dans les hautes dizaines à la vingtaine de pourcents en glissement annuel ces derniers trimestres ; une croissance de 300–400 % des tokens liée à l'IA apparaît donc discordante avec les tendances générales d'achat cloud des entreprises (déclarations d'entreprise, 2024–2026). Cette divergence soulève la question de savoir si la croissance des tokens est concentrée dans une poignée de projets d'expérimentation et de charges internes plutôt que dans une adoption d'entreprise large et généralisée. Si la croissance des tokens ne se traduit pas par une augmentation proportionnelle des facturations cloud, les vendeurs exposés à du matériel intensif en capital font face au risque le plus élevé.
Du point de vue de la valorisation, le marché a intégré l'exposition à l'IA dans les primes de certaines valeurs. NVIDIA (NVDA) cote à des multiples qui anticipent une expansion soutenue des revenus et des marges tirée par l'IA ; toute révision à la baisse du marché adressable due à des comptes de tokens gonflés représenterait un risque baissier pour ces hypothèses. De la même manière, les intégrateurs cloud et les éditeurs de logiciels avec des contrats basés sur la consommation pourraient voir leurs trajectoires de revenus et de marges diverger sensiblement des scénarios pro forma qui supposent une conversion linéaire des tokens en facturations.
Implications sectorielles
Les fabricants de semi‑conducteurs portent le risque de capitalisation le plus explicite. Des sociétés comme NVIDIA ont élargi leurs capacités et anticipé une demande pluriannuelle pour les GPU de centres de données ; si une part significative de la croissance des tokens est non facturable, le calendrier d'absorption des capacités s'allonge et la rotation des stocks ralentit. Pour les fournisseurs cloud, l'impact est asymétrique : alors que les orientations de capex pourraient être modérées, les fournisseurs cloud peuvent plus facilement ajuster le calendrier des achats et amortir les coûts fixes sur un ensemble plus large de services. Cette dynamique favorise, à court terme, les hyperscalers par rapport aux fabricants de puces spécialisés.
Pour les éditeurs de logiciels et les intégrateurs systèmes, la distinction entre croissance des tokens et demande monétisable importe pour les structures contractuelles. Les entreprises vendant des services tarifés à l'appel d'API ou au token subissent une sensibilité directe des revenus ; les éditeurs SaaS à prix fixe sont dans une certaine mesure protégés, mais peuvent subir de l'attrition si les clients ne constatent pas de résultats commerciaux proportionnés aux déploiements d'IA. Les investisseurs devraient donc recalibrer leurs modèles pour différencier la croissance liée à la consommation développeur/test (faible monétisation) et la consommation de production en entreprise (forte monétisation).
Une comparaison pertinente est le passage d'une monétisation basée sur les clics à une monétisation par abonnement dans les médias numériques : ra
Position yourself for the macro moves discussed above
Start TradingSponsored
Ready to trade the markets?
Open a demo account in 30 seconds. No deposit required.
CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. You should consider whether you understand how CFDs work and whether you can afford to take the high risk of losing your money.