tech·en es it zh

La brûlure de jetons IA de Hudson River Trading révèle un goulot d'étranglement de 90 milliards de dollars

1h ago|4 min de lectureStandard

Fazen Markets Editorial Desk

Collective editorial team · methodology

artificial-intelligencemarket-makinghudson-river-tradingai-chipscompute-infrastructure

Sponsoredby Fazen Capital

Vortex HFT — Free Expert Advisor

Trades XAUUSD 24/5 on autopilot. Verified Myfxbook performance. Free forever.

Myfxbook verified No subscription 24/5 automated

Get Free EA

Risk warning: CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. The majority of retail investor accounts lose money when trading CFDs. Vortex HFT is informational software — not investment advice. Past performance does not guarantee future results.

Key Takeaways

1La prochaine phase de l'IA est définie par la rareté de la mémoire, une contrainte désormais visible dans l'allocation de capital des principales entreprises quantitatives.

Partner

Trade the Markets Discussed in This Article

Regulated Broker Competitive Spreads

Start Trading Free Demo Account

CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. You should consider whether you understand how CFDs work and whether you can afford to take the high risk of losing your money.

Hudson River Trading (HRT), l'une des plus grandes sociétés de trading quantitatif au monde, alloue des capitaux à un système interne de jetons IA, comme l'a discuté le responsable IA Iain Dunning. Cette stratégie de gestion des ressources révèle des goulots d'étranglement aigus dans le prix de la mémoire et de la puissance de calcul pour le développement de l'IA. Le système de jetons interne de la société fonctionne comme un prix d'ombre pour l'infrastructure IA, mettant en lumière une contrainte sévère à l'échelle de l'industrie. L'approche de HRT offre un aperçu rare de la manière dont les entreprises intensives en capital priorisent les ressources rares en temps réel pour maintenir des modèles IA compétitifs. Bloomberg a rapporté ce développement le 5 juin 2026, lors d'une conversation de suivi enregistrée lors d'un événement en direct à New York.

Contexte — pourquoi cela compte maintenant

Le boom actuel des investissements dans l'IA fait face à sa première contrainte physique majeure. La bande passante de la mémoire, et non seulement la puissance de calcul brute, est désormais le principal goulot d'étranglement pour le scalage de grands modèles de langage et d'autres systèmes IA. Ce n'était pas la contrainte dominante lors des précédents cycles technologiques comme la révolution mobile des années 2010 ou la première expansion du cloud des années 2000. La structure de coûts pour l'IA avancée a changé de manière décisive vers des architectures intensives en mémoire.

Le système de jetons de HRT est une réponse directe à cette nouvelle réalité de coût. Il internalise la rareté de la mémoire à haute bande passante (HBM) et des GPU avancés dans son propre processus budgétaire. Ce mécanisme de tarification interne oblige les équipes de projet à justifier le coût substantiel de fonctionnement et d'entraînement des modèles IA. Le timing est critique alors qu'Nvidia, le fournisseur dominant, a rapporté que son approvisionnement en HBM reste épuisé jusqu'à fin 2027, avec des prix augmentant de manière séquentielle.

Données — ce que les chiffres montrent

Les coûts internes des jetons de HRT sont directement liés au prix du marché externe de la mémoire et de la puissance de calcul. Les ingénieurs de HRT dépensent des jetons virtuels équivalents à des millions de dollars par an pour accéder aux ressources IA internes. Le marché mondial de la mémoire à haute bande passante (HBM) devrait dépasser 90 milliards de dollars de revenus d'ici 2027, contre moins de 20 milliards de dollars en 2024. Cela représente un taux de croissance annuel composé dépassant 120 %.

Un seul GPU Nvidia H100, un standard courant de l'industrie, nécessite actuellement 80 Go de HBM. Le coût de ce sous-système de mémoire constitue désormais plus de 40 % du prix total du module GPU, une augmentation significative par rapport à environ 25 % trois ans auparavant. Ce changement de coût exerce une pression sur l'économie de toutes les entreprises dépendantes de l'IA. Pour comparaison, l'indice PHLX Semiconductor Sector Index (SOX) a gagné 35 % depuis le début de l'année, fortement soutenu par les fabricants de mémoire et de puces IA, contre un gain de 10 % pour le S&P 500.

Composant	Part de coût du GPU en 2024	Part de coût du GPU en 2026
Logique de base (Traitement)	~75 %	~55 %
Mémoire à haute bande passante (HBM)	~25 %	~40 %+

Analyse — ce que cela signifie pour les marchés / secteurs / tickers

Le goulot d'étranglement de la mémoire crée des gagnants et des perdants clairs. Les principaux bénéficiaires sont les fabricants de HBM comme SK Hynix (000660.KS) et Micron Technology (MU), ainsi que les entreprises d'emballage avancé comme Taiwan Semiconductor Manufacturing Company (TSM). Ces entreprises détiennent un pouvoir de tarification alors que la demande dépasse l'offre. Les bénéficiaires secondaires incluent les entreprises développant des logiciels pour utiliser plus efficacement le matériel existant, comme l'écosystème open-source PyTorch.

Inversement, les entreprises de logiciels IA pures avec des coûts d'inférence élevés font face à une pression sur leurs marges. Leurs modèles commerciaux reposent sur une baisse rapide des coûts de calcul, une tendance qui s'est inversée. Les laboratoires IA intensifs en capital pourraient rencontrer des défis de financement alors que les investisseurs examinent les taux de consommation liés au matériel physique. Un contre-argument existe selon lequel des percées logicielles dans la compression de modèles ou des architectures novatrices pourraient atténuer la contrainte de mémoire, mais celles-ci ne sont pas encore prouvées commercialement à grande échelle.

Le positionnement montre un capital institutionnel se déplaçant du logiciel en tant que service (SaaS) vers l'équipement de capital en semi-conducteurs. Les données de flux indiquent une augmentation des positions longues dans l'ETF VanEck Semiconductor (SMH) et un intérêt à la vente croissant dans un panier d'actions d'applications IA brûlant de l'argent. Le commerce est un pari sur les fournisseurs de matériel plutôt que sur les mineurs d'or.

Perspectives — quoi surveiller ensuite

Le prochain catalyseur majeur est le rapport sur les bénéfices du T3 2026 de SK Hynix le 24 juillet 2026. Les analystes examineront les améliorations de rendement HBM et les prévisions de capacité. Le deuxième catalyseur est la conférence GTC de Nvidia en septembre 2026, où les détails de sa prochaine architecture Blackwell Ultra révéleront les spécifications et les prix de la mémoire.

Les niveaux clés à surveiller sont le support de l'indice SOX à 5 200. Une rupture en dessous pourrait signaler une réévaluation des valorisations des actions de puces. Pour les prix de la mémoire, surveillez les prix contractuels pour HBM3e dans les rapports de DRAMeXchange ; des prix soutenus au-dessus de 120 $ par équivalent 8 Go indiquent une tension continue. Le rendement des bons du Trésor à 10 ans, actuellement à 4,2 %, reste un point de référence pour actualiser les cycles de dépenses en capital à long terme dans le secteur technologique.

Questions Fréquemment Posées

Qu'est-ce qu'une brûlure de jetons IA dans une société de trading ?

Une brûlure de jetons IA est un système comptable interne où les équipes d'ingénierie dépensent une monnaie virtuelle pour accéder à des ressources de calcul comme le temps GPU et la mémoire. Cela crée un mécanisme de marché pour allouer une infrastructure rare et coûteuse. Cela oblige les équipes à optimiser leurs modèles IA pour l'efficacité, car un code inefficace consomme directement le budget. La "brûlure" fait référence aux jetons dépensés et retirés de l'allocation de l'équipe, et non à une transaction sur une blockchain publique.

Comment l'utilisation de l'IA par HRT diffère-t-elle de celle des grandes entreprises technologiques ?

HRT déploie l'IA pour la prédiction de marché à haute fréquence et l'exécution des transactions sensibles à la latence, où la vitesse d'inférence est mesurée en microsecondes. Cela diffère de l'accent mis par les grandes entreprises technologiques sur l'entraînement de modèles à grande échelle pour des produits consommateurs comme la recherche ou les chatbots. Les modèles de HRT sont plus petits, spécialisés pour les données financières, et doivent fonctionner en temps réel, rendant la bande passante de la mémoire encore plus critique que pour les tâches d'entraînement par lots plus lentes courantes chez les fournisseurs de cloud.

Les coûts de calcul de l'IA continueront-ils d'augmenter pour tout le monde ?

Les coûts de calcul devraient rester élevés pour les charges de travail IA intensives en mémoire jusqu'à ce qu'une nouvelle offre ou des architectures émergent. Cependant, les coûts pour les tâches moins intensives utilisant du matériel plus ancien peuvent diminuer. La bifurcation crée une économie IA à deux niveaux : des entreprises bien capitalisées ayant accès à des HBM de pointe et celles utilisant des modèles optimisés sur du matériel hérité. Les innovations en informatique neuromorphique ou en processeurs optiques pourraient changer cette dynamique après 2028, mais ne sont pas des facteurs immédiats.

Conclusion

La prochaine phase de l'IA est définie par la rareté de la mémoire, une contrainte désormais visible dans l'allocation de capital des principales entreprises quantitatives.

Disclaimer : Cet article est à des fins d'information uniquement et ne constitue pas un conseil en investissement. Le trading de CFD comporte un risque élevé de perte de capital.