NVIDIA Blackwell rompe récord en benchmark de IA financiera con ganancias de velocidad de 3.2x
Iris Coleman 05 mar 2026 18:17
El GB200 NVL72 de NVIDIA establece un nuevo récord STAC-AI para inferencia LLM en trading financiero, ofreciendo hasta 3.2x de rendimiento sobre la arquitectura Hopper.
La arquitectura Blackwell de NVIDIA acaba de publicar los resultados más rápidos de la historia en el benchmark STAC-AI para inferencia LLM financiera, con el GB200 NVL72 ofreciendo hasta 3.2x de mejoras de rendimiento de GPU única sobre la generación anterior Hopper. Los resultados del 5 de marzo de 2026 son importantes para las firmas de trading que compiten por extraer alfa del análisis de datos no estructurados.
El Strategic Technology Analysis Center, que ha evaluado cargas de trabajo de tecnología financiera durante más de 15 años, probó Blackwell contra escenarios del mundo real utilizando presentaciones EDGAR 10-K, los densos informes anuales que los fondos cuantitativos analizan en busca de señales de inversión. Ejecutando los modelos Llama 3.1 de Meta, el GB200 NVL72 alcanzó 37,480 palabras por segundo en prompts financieros de longitud media, comparado con 8,237 WPS para sistemas GH200 duales.
Los números brutos cuentan la historia
En el modelo Llama 3.1 8B con datos EDGAR4, Blackwell procesó 224 solicitudes por segundo versus 51.5 RPS para Hopper, una mejora de 4.3x a nivel de sistema. La brecha se amplió en tareas computacionalmente más pesadas: el modelo de parámetros 70B en presentaciones EDGAR5 de contexto largo vio el rendimiento saltar de 41.4 WPS a 150 WPS.
¿Qué hace posibles estas ganancias? El nuevo formato de cuantización NVFP4 de NVIDIA, exclusivo de Blackwell, comprime modelos en huellas de memoria más pequeñas sin sacrificar precisión. Hopper ejecutó cuantización FP8; el salto arquitectónico a precisión de cuatro bits en Blackwell desbloquea el delta de rendimiento.
El rendimiento interactivo importa para el trading
El procesamiento por lotes es una cosa. Las decisiones de trading en tiempo real requieren respuestas rápidas. Aquí, Blackwell mantuvo tiempos de reacción más bajos (análogos al tiempo hasta el primer token) y mejor latencia entre palabras incluso cuando se empujó hacia el rendimiento máximo. En niveles de utilización igualados, el GB200 NVL72 superó consistentemente al GH200 en métricas de capacidad de respuesta en la mayoría de los escenarios de prueba.
Para mesas de trading ejecutando análisis de sentimiento en llamadas de ganancias o analizando noticias de última hora, esa ventaja de latencia se traduce directamente en toma de decisiones más rápida. El benchmark probó explícitamente el pipeline de inferencia completo incluyendo tokenización, trabajo que los despliegues reales no pueden omitir.
Contexto del mercado
Las acciones de NVIDIA cotizaron a $181.41 el 5 de marzo, con un aumento del 1.1% en el día, con la capitalización de mercado de la compañía situada en $4.42 billones. La arquitectura Blackwell, anunciada en GTC 2024, fue diseñada específicamente para cargas de trabajo de IA generativa. El CEO Jensen Huang la posicionó como impulsora de "una nueva revolución industrial", y estos resultados de benchmark proporcionan evidencia concreta para esa afirmación en el sector financiero.
El superchip GB200 Grace Blackwell combina dos GPUs B200 con una CPU Grace, presentando AI Tensor Cores rediseñados y NVLink de quinta generación para escalar hasta 576 GPUs. Los resultados anteriores de MLPerf mostraron ganancias de entrenamiento de 2.2x en Llama 3.1 405B; estos números STAC-AI confirman que ventajas similares se extienden a la inferencia.
Hopper sigue siendo relevante
Vale la pena señalar: la arquitectura Hopper de tres años publicó números respetables. Las firmas de trading con despliegues GH200 existentes no quedan obsoletas de la noche a la mañana. Pero para nuevas construcciones o firmas donde la velocidad de inferencia impacta directamente los retornos, la economía de Blackwell se ve convincente: NVIDIA afirma hasta 25x de reducción en costos operativos de inferencia LLM versus generaciones anteriores.
Los informes STAC completos, incluyendo métricas detalladas de modo interactivo en varias tasas de llegada, están disponibles a través de los canales oficiales de STAC. Las instituciones financieras que evalúan actualizaciones de infraestructura de IA ahora tienen datos auditados de terceros para informar decisiones de adquisición.
Fuente de la imagen: Shutterstock- nvidia
- blackwell
- inferencia de IA
- trading financiero
- llm

