tech·en es fr zh

La bruciatura dei token AI di Hudson River Trading rivela un collo di bottiglia da $90 miliardi

1h ago|4 min letturaStandard

Fazen Markets Editorial Desk

Collective editorial team · methodology

artificial-intelligencemarket-makinghudson-river-tradingai-chipscompute-infrastructure

Sponsoredby Fazen Capital

Vortex HFT — Free Expert Advisor

Trades XAUUSD 24/5 on autopilot. Verified Myfxbook performance. Free forever.

Myfxbook verified No subscription 24/5 automated

Get Free EA

Risk warning: CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. The majority of retail investor accounts lose money when trading CFDs. Vortex HFT is informational software — not investment advice. Past performance does not guarantee future results.

Punti Chiave

1L'attuale boom degli investimenti in AI affronta il suo primo grande vincolo fisico.
2I costi interni dei token di HRT sono direttamente legati al prezzo di mercato esterno della memoria e del calcolo.
3Il collo di bottiglia della memoria crea chiari vincitori e vinti.

Partner

Trade the Markets Discussed in This Article

Regulated Broker Competitive Spreads

Start Trading Free Demo Account

CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. You should consider whether you understand how CFDs work and whether you can afford to take the high risk of losing your money.

Hudson River Trading (HRT), una delle più grandi società di trading quantitativo al mondo, sta allocando capitale a un sistema interno di token AI, come discusso dal capo AI Iain Dunning. Questa strategia di gestione delle risorse rivela gravi colli di bottiglia nel prezzo della memoria e della potenza di calcolo per lo sviluppo dell'AI. Il sistema di token interno dell'azienda funge da prezzo ombra per l'infrastruttura AI, evidenziando una grave restrizione a livello di settore. L'approccio di HRT offre uno sguardo raro su come le aziende ad alta intensità di capitale stanno dando priorità alle risorse scarse in tempo reale per mantenere modelli AI competitivi. Bloomberg ha riportato questo sviluppo il 5 giugno 2026, durante una conversazione di follow-up registrata a un evento dal vivo a New York.

Contesto — perché è importante ora

L'attuale boom degli investimenti in AI affronta il suo primo grande vincolo fisico. La larghezza di banda della memoria, non solo la potenza di calcolo grezza, è ora il principale collo di bottiglia per la scalabilità di grandi modelli linguistici e altri sistemi AI. Questo non era il vincolo dominante nei precedenti cicli tecnologici come la rivoluzione mobile degli anni 2010 o l'espansione del cloud degli anni 2000. La struttura dei costi per l'AI avanzata si è spostata decisamente verso architetture ad alta intensità di memoria.

Il sistema di token di HRT è una risposta diretta a questa nuova realtà dei costi. Internazionalizza la scarsità di memoria ad alta larghezza di banda (HBM) e GPU avanzate nel proprio processo di budgeting. Questo meccanismo di pricing interno costringe i team di progetto a giustificare il costo sostanziale di esecuzione e addestramento dei modelli AI. Il tempismo è critico poiché Nvidia, il fornitore dominante, ha riportato che la sua fornitura di HBM rimane esaurita fino alla fine del 2027, con prezzi in aumento sequenziale.

Dati — cosa mostrano i numeri

I costi interni dei token di HRT sono direttamente legati al prezzo di mercato esterno della memoria e del calcolo. Gli ingegneri di HRT spendono token virtuali equivalenti a milioni di dollari all'anno per accedere alle risorse interne di AI. Si prevede che il mercato globale della memoria ad alta larghezza di banda (HBM) supererà i 90 miliardi di dollari di fatturato entro il 2027, rispetto a meno di 20 miliardi di dollari nel 2024. Questo rappresenta un tasso di crescita annuale composto superiore al 120%.

Una singola GPU Nvidia H100, uno standard comune del settore, richiede attualmente 80GB di HBM. Il costo di questo sottosistema di memoria ora costituisce oltre il 40% del prezzo totale del modulo GPU, un aumento significativo rispetto al 25% circa di tre anni fa. Questo spostamento dei costi esercita pressione sull'economia di tutte le aziende dipendenti dall'AI. A titolo di confronto, l'indice del settore semiconduttori PHLX (SOX) ha guadagnato il 35% dall'inizio dell'anno, fortemente trainato dai produttori di memoria e chip AI, rispetto al guadagno del 10% dell'S&P 500.

Componente	Quota di costo GPU 2024	Quota di costo GPU 2026
Logica di base (Elaborazione)	~75%	~55%
Memoria ad alta larghezza di banda (HBM)	~25%	~40%+

Analisi — cosa significa per i mercati / settori / ticker

Il collo di bottiglia della memoria crea chiari vincitori e vinti. I principali beneficiari sono i produttori di HBM come SK Hynix (000660.KS) e Micron Technology (MU), e le aziende di packaging avanzato come Taiwan Semiconductor Manufacturing Company (TSM). Queste aziende detengono il potere di determinare i prezzi poiché la domanda supera l'offerta. I beneficiari secondari includono le aziende che sviluppano software per utilizzare l'hardware esistente in modo più efficiente, come l'ecosistema open-source PyTorch.

Al contrario, le aziende di software AI puri con alti costi di inferenza affrontano una pressione sui margini. I loro modelli di business si basano su costi di calcolo in rapido calo, una tendenza che si è invertita. I laboratori AI ad alta intensità di capitale potrebbero affrontare sfide di raccolta fondi mentre gli investitori esaminano i tassi di consumo legati all'hardware fisico. Esiste un contro-argomento secondo cui le innovazioni nel software nella compressione dei modelli o in architetture nuove potrebbero alleviare il vincolo della memoria, ma queste non sono ancora state dimostrate commercialmente su larga scala.

Il posizionamento mostra il capitale istituzionale ruotare da software-as-a-service (SaaS) a attrezzature per semiconduttori. I dati sui flussi indicano un aumento delle posizioni lunghe nell'ETF VanEck Semiconductor (SMH) e un aumento dell'interesse short in un paniere di azioni di applicazioni AI in perdita. Il trade è una scommessa sui fornitori di attrezzature piuttosto che sui minatori d'oro.

Prospettive — cosa osservare successivamente

Il prossimo grande catalizzatore sono gli utili di SK Hynix per il Q3 2026 il 24 luglio 2026. Gli analisti esamineranno i miglioramenti dei rendimenti HBM e le indicazioni sulla capacità. Il secondo catalizzatore è la conferenza GTC di Nvidia a settembre 2026, dove i dettagli della sua architettura Blackwell Ultra di nuova generazione riveleranno specifiche e prezzi della memoria.

I livelli chiave da monitorare sono il supporto dell'indice SOX a 5.200. Una rottura al di sotto potrebbe segnalare una rivalutazione delle valutazioni delle azioni dei chip. Per i prezzi della memoria, osservare i prezzi contrattuali per HBM3e nei rapporti DRAMeXchange; prezzi sostenuti sopra i 120 dollari per equivalente da 8GB indicano una continua tensione. Il rendimento del Treasury a 10 anni, attualmente al 4,2%, rimane un punto di riferimento per scontare i cicli di spesa in conto capitale a lungo termine nel settore tecnologico.

Domande Frequenti

Cos'è una bruciatura di token AI in una società di trading?

Una bruciatura di token AI è un sistema contabile interno in cui i team di ingegneria spendono una valuta virtuale per accedere a risorse computazionali come tempo GPU e memoria. Questo crea un meccanismo di mercato per allocare infrastrutture scarse e costose. Costringe i team a ottimizzare i propri modelli AI per l'efficienza, poiché il codice inefficiente consuma direttamente il budget. La "bruciatura" si riferisce ai token spesi e rimossi dall'allocazione del team, non a una transazione pubblica sulla blockchain.

In che modo l'uso dell'AI di HRT differisce da quello delle grandi aziende tecnologiche?

HRT utilizza l'AI per previsioni di mercato ad alta frequenza e latenza, dove la velocità di inferenza è misurata in microsecondi. Questo differisce dal focus delle grandi aziende tecnologiche sull'addestramento di modelli su larga scala per prodotti consumer come motori di ricerca o chatbot. I modelli di HRT sono più piccoli, specializzati per i dati finanziari e devono funzionare in tempo reale, rendendo la larghezza di banda della memoria ancora più critica rispetto ai compiti di addestramento più lenti e orientati ai batch comuni presso i fornitori di cloud.

I costi di calcolo dell'AI continueranno a salire per tutti?

I costi di calcolo rimarranno probabilmente elevati per i carichi di lavoro AI ad alta intensità di memoria fino a quando non emergeranno nuove forniture o architetture. Tuttavia, i costi per compiti meno intensivi che utilizzano hardware più vecchio potrebbero diminuire. La biforcazione crea un'economia AI a due livelli: aziende ben capitalizzate con accesso a HBM all'avanguardia e quelle che utilizzano modelli ottimizzati su hardware legacy. Innovazioni nel calcolo neuromorfico o nei processori ottici potrebbero cambiare questa dinamica dopo il 2028, ma non sono fattori immediati.

Risultato finale

La prossima fase dell'AI è definita dalla scarsità di memoria, un vincolo ora visibile nell'allocazione di capitale delle principali aziende quantitative.

Disclaimer: Questo articolo è solo a scopo informativo e non costituisce consulenza agli investimenti. Il trading di CFD comporta un alto rischio di perdita di capitale.