Alibaba Group Holding Limited cerró en $167.05, marcando un aumento del 1.19%, tras un gran avance en infraestructura de IA.
Alibaba Group Holding Limited, BABA
La compañía introdujo una solución de agrupación de computación que redujo el uso de GPU de Nvidia en un 82% en operaciones de servicio de modelos. Este avance posiciona a Alibaba Cloud por delante en la carrera para optimizar el despliegue de IA a escala.
Alibaba Cloud, la división de computación en la nube de la firma con sede en Hangzhou, implementó un nuevo sistema llamado Aegaeon para impulsar la eficiencia de IA. La solución permite que una sola GPU Nvidia H20 sirva hasta siete modelos de lenguaje grandes simultáneamente. Este cambio redujo el uso de GPU de 1.192 a solo 213 unidades durante las pruebas internas.
Aegaeon funciona realizando auto escala a nivel de token durante la inferencia de modelos en cargas de trabajo de IA concurrentes. Esta estrategia permite la reasignación dinámica de recursos, permitiendo que la misma GPU cambie entre modelos durante el procesamiento. También redujo la latencia en tareas de cambio de modelo en un 97%.
La solución fue probada en versión beta durante más de tres meses en el marketplace Bailian de Alibaba Cloud. Gestionó docenas de modelos con hasta 72 mil millones de parámetros sin degradación del servicio. Aegaeon ha sido formalmente implementado en el marketplace de modelos de Alibaba, que sirve sus modelos propietarios Qwen.
Alibaba Cloud descubrió que solo un pequeño número de modelos se utilizan frecuentemente en tareas de IA del mundo real. A pesar de esto, muchas GPUs fueron asignadas a modelos raramente llamados, resultando en una baja utilización de recursos. Los datos mostraron que el 17.7% de las GPUs atendían solo el 1.35% del total de solicitudes de inferencia.
Con Aegaeon, la compañía resolvió este desequilibrio mediante estrategias de agrupación y escalado inteligente. El sistema aseguró un uso consistente de GPU y evitó el procesamiento inactivo en modelos raramente utilizados. Alibaba logró mayor rendimiento y mejoró la eficiencia del hardware para implementaciones empresariales.
Investigadores de la Universidad de Pekín y Alibaba Cloud coescribieron un artículo técnico detallando la innovación, presentado en SOSP 2025 en Corea del Sur. El estudio subrayó que servir cargas de trabajo concurrentes con métodos tradicionales de GPU incurría en costos innecesarios. Este avance apoya directamente el objetivo de China de modernización de infraestructura de IA bajo restricciones de recursos.
Nvidia desarrolló la GPU H20 específicamente para inferencia de IA en China, cumpliendo con las restricciones de exportación de EE.UU. Sin embargo, los reguladores chinos recientemente iniciaron una investigación sobre posibles vulnerabilidades de seguridad en el chip. Este escrutinio ha afectado la posición de mercado del chip y su adopción dentro de China.
Empresas chinas como Huawei y Cambricon están acelerando el desarrollo de GPUs domésticas para reducir la dependencia extranjera. El CEO de Nvidia declaró que la participación de mercado de la compañía para chips avanzados de IA en China ha caído a cero. Esta tendencia impulsa a los actores locales a innovar y localizar las cadenas de suministro de hardware de IA.
El nuevo enfoque de Alibaba fortalece su posición en el mercado mientras se alinea con las estrategias nacionales para la autosuficiencia tecnológica. Al reducir la dependencia de chips estadounidenses, Alibaba gana una posición más fuerte en el ecosistema de IA en evolución de China. El aumento de las acciones refleja la confianza en el ahorro de costos y la escalabilidad impulsados por la tecnología.
La publicación Las acciones de Alibaba Group Holding Limited (BABA) se disparan mientras la nueva tecnología de agrupación de IA reduce el uso de GPU de Nvidia en un 82% apareció primero en CoinCentral.



