La quema de tokens de IA de Hudson River Trading revela un estrangulamiento de $90B
Fazen Markets Editorial Desk
Collective editorial team · methodology
Vortex HFT — Free Expert Advisor
Trades XAUUSD 24/5 on autopilot. Verified Myfxbook performance. Free forever.
Risk warning: CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. The majority of retail investor accounts lose money when trading CFDs. Vortex HFT is informational software — not investment advice. Past performance does not guarantee future results.
Hudson River Trading (HRT), una de las mayores firmas de trading cuantitativo del mundo, está asignando capital a un sistema interno de tokens de IA, como lo discutió el jefe de IA Iain Dunning. Esta estrategia de gestión de recursos revela cuellos de botella agudos en el precio de la memoria y la potencia de cálculo para el desarrollo de IA. El sistema interno de tokens de HRT funciona como un precio sombra para la infraestructura de IA, destacando una severa restricción en toda la industria. El enfoque de HRT ofrece una rara visión de cómo las firmas intensivas en capital están priorizando recursos escasos en tiempo real para mantener modelos de IA competitivos. Bloomberg informó sobre este desarrollo el 5 de junio de 2026, durante una conversación de seguimiento grabada en un evento en vivo en Nueva York.
Contexto — por qué esto importa ahora
El actual auge de inversión en IA enfrenta su primera gran restricción física. El ancho de banda de memoria, no solo la potencia de cálculo en bruto, es ahora el principal cuello de botella para escalar grandes modelos de lenguaje y otros sistemas de IA. Esta no era la restricción dominante en ciclos tecnológicos anteriores como la revolución móvil de la década de 2010 o la expansión temprana de la nube de la década de 2000. La estructura de costos para la IA avanzada se ha desplazado de manera decisiva hacia arquitecturas intensivas en memoria.
El sistema de tokens de HRT es una respuesta directa a esta nueva realidad de costos. Internaliza la escasez de memoria de alto ancho de banda (HBM) y GPUs avanzadas en su propio proceso de presupuestación. Este mecanismo de precios interno obliga a los equipos de proyectos a justificar el costo sustancial de ejecutar y entrenar modelos de IA. El momento es crítico ya que Nvidia, el proveedor dominante, informó que su suministro de HBM sigue agotado hasta finales de 2027, con precios en aumento secuencialmente.
Datos — lo que muestran los números
Los costos internos de tokens de HRT están directamente relacionados con el precio del mercado externo de memoria y cálculo. Los ingenieros de HRT gastan tokens virtuales equivalentes a millones de dólares anuales para acceder a recursos internos de IA. Se prevé que el mercado global de memoria de alto ancho de banda (HBM) supere los $90 mil millones en ingresos para 2027, frente a menos de $20 mil millones en 2024. Esto representa una tasa de crecimiento anual compuesta que supera el 120%.
Una sola GPU Nvidia H100, un estándar común en la industria, requiere actualmente 80GB de HBM. El costo de este subsistema de memoria ahora constituye más del 40% del precio total del módulo GPU, un aumento significativo desde aproximadamente el 25% hace tres años. Este cambio de costos presiona la economía de todos los negocios dependientes de IA. Para comparación, el Índice de Sector de Semiconductores PHLX (SOX) ha ganado un 35% en lo que va del año, impulsado en gran medida por fabricantes de memoria y chips de IA, en comparación con la ganancia del 10% del S&P 500.
| Componente | Participación del costo de GPU 2024 | Participación del costo de GPU 2026 |
|---|---|---|
| Lógica central (Procesamiento) | ~75% | ~55% |
| Memoria de alto ancho de banda (HBM) | ~25% | ~40%+ |
Análisis — lo que significa para los mercados / sectores / tickers
El cuello de botella de memoria crea ganadores y perdedores claros. Los principales beneficiarios son los fabricantes de HBM como SK Hynix (000660.KS) y Micron Technology (MU), y las empresas de empaquetado avanzado como Taiwan Semiconductor Manufacturing Company (TSM). Estas empresas tienen poder de fijación de precios a medida que la demanda supera la oferta. Los beneficiarios secundarios incluyen empresas que desarrollan software para utilizar el hardware existente de manera más eficiente, como el ecosistema de código abierto PyTorch.
Por el contrario, las empresas de software de IA puras con altos costos de inferencia enfrentan presión sobre sus márgenes. Sus modelos de negocio dependen de la rápida disminución de los costos de cálculo, una tendencia que se ha revertido. Los laboratorios de IA intensivos en capital pueden enfrentar desafíos de financiación a medida que los inversores examinan las tasas de quema vinculadas al hardware físico. Existe un contraargumento de que los avances en software en la compresión de modelos o arquitecturas novedosas podrían aliviar la restricción de memoria, pero estos aún no se han probado comercialmente a gran escala.
El posicionamiento muestra que el capital institucional está rotando de software como servicio (SaaS) a equipos de capital de semiconductores. Los datos de flujo indican un aumento de posiciones largas en el ETF de Semiconductores VanEck (SMH) y un creciente interés corto en un grupo de acciones de aplicaciones de IA que queman efectivo. La operación es una apuesta por los proveedores de herramientas sobre los mineros de oro.
Perspectivas — qué observar a continuación
El próximo catalizador importante son los resultados de SK Hynix del tercer trimestre de 2026 el 24 de julio de 2026. Los analistas examinarán las mejoras en el rendimiento de HBM y la orientación de capacidad. El segundo catalizador es la conferencia GTC de Nvidia en septiembre de 2026, donde los detalles de su arquitectura de próxima generación Blackwell Ultra revelarán especificaciones de memoria y precios.
Los niveles clave a monitorear son el soporte del índice SOX en 5,200. Una ruptura por debajo podría señalar una reevaluación de las valoraciones de las acciones de chips. Para los precios de la memoria, observe los precios de contrato para HBM3e en los informes de DRAMeXchange; precios sostenidos por encima de $120 por equivalente de 8GB indican una continua tensión. El rendimiento del Tesoro a 10 años, actualmente en 4.2%, sigue siendo un referente para descontar los ciclos de gasto de capital a largo plazo en el sector tecnológico.
Preguntas Frecuentes
¿Qué es una quema de tokens de IA en una firma de trading?
Una quema de tokens de IA es un sistema contable interno donde los equipos de ingeniería gastan una moneda virtual para acceder a recursos computacionales como tiempo de GPU y memoria. Esto crea un mecanismo de mercado para asignar infraestructura escasa y costosa. Obliga a los equipos a optimizar sus modelos de IA para la eficiencia, ya que el código derrochador consume directamente el presupuesto. La "quema" se refiere a los tokens que se gastan y se eliminan de la asignación del equipo, no a una transacción en una blockchain pública.
¿Cómo difiere el uso de IA de HRT de las grandes empresas tecnológicas?
HRT despliega IA para la predicción del mercado y ejecución de operaciones de alta frecuencia sensibles a la latencia, donde la velocidad de inferencia se mide en microsegundos. Esto difiere del enfoque de las grandes empresas tecnológicas en el entrenamiento de modelos a gran escala para productos de consumo como búsquedas o chatbots. Los modelos de HRT son más pequeños, especializados en datos financieros, y deben ejecutarse en tiempo real, lo que hace que el ancho de banda de memoria sea aún más crítico que para tareas de entrenamiento más lentas y orientadas a lotes comunes en proveedores de nube.
¿Seguirán aumentando los costos de cálculo de IA para todos?
Es probable que los costos de cálculo se mantengan elevados para cargas de trabajo de IA intensivas en memoria hasta que surjan nuevos suministros o arquitecturas. Sin embargo, los costos para tareas menos intensivas que utilizan hardware más antiguo pueden disminuir. La bifurcación crea una economía de IA de dos niveles: empresas bien capitalizadas con acceso a HBM de vanguardia y aquellas que utilizan modelos optimizados en hardware legado. Innovaciones en computación neuromórfica o procesadores ópticos podrían cambiar esta dinámica después de 2028, pero no son factores inmediatos.
Conclusión
La próxima fase de la IA está definida por la escasez de memoria, una restricción ahora visible en la asignación de capital de las principales firmas cuantitativas.
Descargo de responsabilidad: Este artículo es solo para fines informativos y no constituye asesoramiento de inversión. El trading de CFD conlleva un alto riesgo de pérdida de capital.
Trade XAUUSD on autopilot — free Expert Advisor
Vortex HFT is our free MT4/MT5 Expert Advisor. Verified Myfxbook performance. No subscription. No fees. Trades 24/5.
Position yourself for the macro moves discussed above
Start TradingSponsored
Ready to trade the markets?
Open a demo account in 30 seconds. No deposit required.
CFDs are complex instruments and come with a high risk of losing money rapidly due to leverage. You should consider whether you understand how CFDs work and whether you can afford to take the high risk of losing your money.