Crescita dei token AI sopravvalutata, Anthropic avverte
Fazen Markets Research
Expert Analysis
Paragrafo introduttivo
La metrica di utilizzo principale per i grandi modelli linguistici — il conteggio lordo dei "token" processati — è diventata una narrativa centrale per la crescita dell'AI, ma i dati sottostanti richiedono un'analisi più attenta. CNBC ha riportato il 17 apr 2026 che i volumi di token per i modelli commerciali sono aumentati di circa 300–400% su base annua (CNBC, 17 apr 2026), un'impennata che sulla carta sostiene ipotesi di crescita dei ricavi pluriennali per fornitori cloud, produttori di chip e operatori di modelli. Le recenti dichiarazioni pubbliche di Anthropic contrastano con molte assunzioni di mercato: la società ha segnalato che le metriche sui token possono essere gonfiate da pre-elaborazione, richieste sintetiche e traffico di benchmarking interno, e che la crescita reale della domanda da parte dei clienti è materialmente inferiore rispetto ad alcuni valori di copertina (CNBC, 17 apr 2026). Per gli investitori istituzionali, la distinzione tra la crescita dei token di copertina e il consumo di token economicamente rilevante — traffico a pagamento, esterno e in produzione — è cruciale per i modelli di ricavo, i piani di CAPEX e le previsioni di domanda di semiconduttori.
Contesto
Il conteggio dei token è attraente perché è semplice e apparentemente oggettivo: ogni chiamata API o esecuzione di modello consuma token, e aggregarli produce un tasso di crescita facile da comunicare. Tuttavia i modelli differiscono nel modo in cui i token si traducono in valore economico. Uno scambio conversazionale di 1.000 token può rappresentare un cliente pagante che utilizza un flusso di lavoro critico, oppure un test sviluppatore, un'esecuzione di benchmarking interno o un carico di lavoro generato sinteticamente che gonfia i volumi aggregati senza tradursi in ricavi duraturi. Il servizio di CNBC del 17 apr 2026 ha evidenziato che una grande quota degli incrementi di centinaia di percentuali osservati potrebbe riflettere queste categorie non rappresentative piuttosto che aumenti proporzionali nell'utilizzo monetizzabile (CNBC, 17 apr 2026).
Storicamente, il mercato è migrato da metriche di utilizzo grezze verso KPI monetizzabili — MAU (utenti attivi mensili), ARPU (ricavo medio per utente) e retention dei ricavi — quando le narrative si sono dimostrate fuorvianti. Episodi comparabili includono le metriche delle piattaforme social negli anni 2010 in cui i tassi di engagement riportati nascondevano traffico di bot, e i servizi cloud alla fine degli anni 2010 dove trial e test interni gonfiavano l'utilizzo prima della conversione. Dato che grandi incumbent hanno costruito modelli di allocazione del capitale e di valutazione basati su traiettorie di domanda fondate sui token, una nuova valutazione potrebbe essere innescata se si osservassero rapporti di conversione o di fatturazione significativamente più bassi.
Il timing è importante. L'impennata dei token e il successivo richiamo coincidono con un ciclo di investimento in GPU e infrastrutture cloud. Se la crescita del 300–400% dei token è in larga parte non fatturabile o effimera, allora i produttori di chip e gli operatori cloud potrebbero affrontare una discrepanza tra l'espansione della capacità e la domanda produttiva. Viceversa, se una quota significativa dell'impennata si converte in spesa enterprise SaaS, il ciclo infrastrutturale sarà sostenuto da fatturato reale. I prossimi 12 mesi di metriche di conversione in fatturato saranno quindi decisivi per i mercati finanziari.
Analisi dei dati
Le cifre specifiche riportate dal pezzo di CNBC offrono un punto di partenza: volumi di token in aumento stimato del 300–400% YoY al 17 apr 2026 (CNBC, 17 apr 2026). La caratterizzazione interna di Anthropic — riportata da CNBC — suggerisce che, una volta escluso il traffico sintetico e interno, i token incrementali guidati dai clienti potrebbero essere inferiori del 30–60% rispetto ai totali di copertina. Quell'intervallo implica una potenziale rettifica al ribasso delle previsioni di mercato che ha implicazioni immediate per la domanda prevista di cloud e GPU.
Confrontate queste cifre di crescita dei token con indicatori più ampi della domanda di calcolo. La crescita dei ricavi del cloud pubblico per i fornitori principali (AWS, Azure, GCP) è stata nell'ordine delle alte decine di punti percentuali fino alle basse venti percentuali YoY negli ultimi trimestri; una crescita del 300–400% nei token AI appare quindi discordante rispetto ai modelli complessivi di acquisto enterprise di cloud (documenti societari, 2024–2026). Questa divergenza solleva la questione se la crescita dei token sia concentrata in una manciata di progetti di sperimentazione e carichi di lavoro interni piuttosto che in un'adozione enterprise generalizzata. Se la crescita dei token non si traduce in un aumento proporzionale delle fatturazioni cloud, i fornitori con esposizione a hardware intensivo di capitale affrontano il rischio maggiore.
Da una prospettiva di valutazione, il mercato ha scontato l'esposizione all'AI in premi per alcune azioni selezionate. NVIDIA (NVDA) quota multipli che anticipano un'espansione dei ricavi e dei margini guidata dall'AI; qualsiasi revisione al ribasso del mercato indirizzabile dovuta a conteggi di token gonfiati rappresenterebbe un rischio al ribasso per tali assunzioni. Analogamente, integratori cloud e fornitori software con contratti basati sul consumo potrebbero vedere traiettorie di ricavo e margine divergere materialmente dagli scenari pro-forma che assumono una conversione lineare dai token alle fatturazioni.
Implicazioni per il settore
I produttori di semiconduttori portano il rischio di capitalizzazione più esplicito. Aziende come NVIDIA hanno ampliato la capacità e prezzato su più anni la domanda di GPU per data center; se una quota significativa della crescita dei token è non fatturabile, la tempistica per l'assorbimento della capacità si allunga e i giri di inventario rallentano. Per i fornitori cloud l'impatto è asimmetrico: mentre le guidance sul CAPEX potrebbero essere moderate, i provider cloud possono più agevolmente modulare i tempi di approvvigionamento e ammortizzare i costi fissi su un portafoglio più ampio di servizi. Questa dinamica avvantaggia gli hyperscaler rispetto ai produttori di chip specializzati nel breve termine.
Per i fornitori software e gli system integrator, la distinzione tra crescita dei token e domanda monetizzabile influisce sulle strutture contrattuali. Le società che vendono servizi prezzati per chiamata API o per token affrontano una sensibilità diretta dei ricavi; i vendor SaaS con abbonamenti a prezzo fisso sono in parte isolati, ma potrebbero osservare churn se i clienti non rilevano risultati di business commisurati dalle implementazioni AI. Gli investitori dovrebbero quindi ricalibrare i modelli per differenziare tra crescita nel consumo da sviluppatori/test (bassa monetizzazione) e consumo in produzione enterprise (alta monetizzazione).
Un confronto rilevante è lo spostamento dalla monetizzazione basata sui click a quella basata su abbonamento nei media digitali: ra
Position yourself for the macro moves discussed above
Start TradingSponsored
Ready to trade the markets?
Open a demo account in 30 seconds. No deposit required.
CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. You should consider whether you understand how CFDs work and whether you can afford to take the high risk of losing your money.