TLDR Alibaba reduce el uso de GPU en un 82% con Aegaeon, impulsando la IA a escala masiva. Aegaeon reduce la latencia de cambio de modelos de IA en un 97%, mejorando el rendimiento. Una GPU Nvidia H20 ahora ejecuta 7 LLMs simultáneamente en la actualización de IA de Alibaba. Alibaba Cloud mejora la eficiencia de GPU con auto escala a nivel de token. Aegaeon impulsa los objetivos de IA de China mientras reduce la dependencia de chips Nvidia. [...] La publicación Las acciones de Alibaba Group Holding Limited (BABA) se disparan mientras la nueva tecnología de agrupación de IA reduce el uso de GPU Nvidia en un 82% apareció primero en CoinCentral.TLDR Alibaba reduce el uso de GPU en un 82% con Aegaeon, impulsando la IA a escala masiva. Aegaeon reduce la latencia de cambio de modelos de IA en un 97%, mejorando el rendimiento. Una GPU Nvidia H20 ahora ejecuta 7 LLMs simultáneamente en la actualización de IA de Alibaba. Alibaba Cloud mejora la eficiencia de GPU con auto escala a nivel de token. Aegaeon impulsa los objetivos de IA de China mientras reduce la dependencia de chips Nvidia. [...] La publicación Las acciones de Alibaba Group Holding Limited (BABA) se disparan mientras la nueva tecnología de agrupación de IA reduce el uso de GPU Nvidia en un 82% apareció primero en CoinCentral.

Las acciones de Alibaba Group Holding Limited (BABA) se disparan mientras la nueva tecnología de agrupación de IA reduce el uso de GPU de Nvidia en un 82%

2025/10/18 20:15
Lectura de 4 min
Si tienes comentarios o inquietudes sobre este contenido, comunícate con nosotros mediante crypto.news@mexc.com

TLDR

  • Alibaba reduce el uso de GPU en un 82% con Aegaeon, impulsando la IA a escala masiva.
  • Aegaeon reduce la latencia de cambio de modelos de IA en un 97%, mejorando el rendimiento.
  • Una GPU Nvidia H20 ahora ejecuta 7 LLMs simultáneamente en la actualización de IA de Alibaba.
  • Alibaba Cloud mejora la eficiencia de GPU con auto escala a nivel de token.
  • Aegaeon impulsa los objetivos de IA de China mientras reduce la dependencia de chips Nvidia.

Alibaba Group Holding Limited cerró en $167.05, marcando un aumento del 1.19%, tras un gran avance en infraestructura de IA.

BABA Stock Card

Alibaba Group Holding Limited, BABA

La compañía introdujo una solución de agrupación de computación que redujo el uso de GPU de Nvidia en un 82% en operaciones de servicio de modelos. Este avance posiciona a Alibaba Cloud por delante en la carrera para optimizar el despliegue de IA a escala.

Aegaeon aumenta la eficiencia, reduce la dependencia de GPU

Alibaba Cloud, la división de computación en la nube de la firma con sede en Hangzhou, implementó un nuevo sistema llamado Aegaeon para impulsar la eficiencia de IA. La solución permite que una sola GPU Nvidia H20 sirva hasta siete modelos de lenguaje grandes simultáneamente. Este cambio redujo el uso de GPU de 1.192 a solo 213 unidades durante las pruebas internas.

Aegaeon funciona realizando auto escala a nivel de token durante la inferencia de modelos en cargas de trabajo de IA concurrentes. Esta estrategia permite la reasignación dinámica de recursos, permitiendo que la misma GPU cambie entre modelos durante el procesamiento. También redujo la latencia en tareas de cambio de modelo en un 97%.

La solución fue probada en versión beta durante más de tres meses en el marketplace Bailian de Alibaba Cloud. Gestionó docenas de modelos con hasta 72 mil millones de parámetros sin degradación del servicio. Aegaeon ha sido formalmente implementado en el marketplace de modelos de Alibaba, que sirve sus modelos propietarios Qwen.

Perspectivas del mercado de modelos y optimización del rendimiento

Alibaba Cloud descubrió que solo un pequeño número de modelos se utilizan frecuentemente en tareas de IA del mundo real. A pesar de esto, muchas GPUs fueron asignadas a modelos raramente llamados, resultando en una baja utilización de recursos. Los datos mostraron que el 17.7% de las GPUs atendían solo el 1.35% del total de solicitudes de inferencia.

Con Aegaeon, la compañía resolvió este desequilibrio mediante estrategias de agrupación y escalado inteligente. El sistema aseguró un uso consistente de GPU y evitó el procesamiento inactivo en modelos raramente utilizados. Alibaba logró mayor rendimiento y mejoró la eficiencia del hardware para implementaciones empresariales.

Investigadores de la Universidad de Pekín y Alibaba Cloud coescribieron un artículo técnico detallando la innovación, presentado en SOSP 2025 en Corea del Sur. El estudio subrayó que servir cargas de trabajo concurrentes con métodos tradicionales de GPU incurría en costos innecesarios. Este avance apoya directamente el objetivo de China de modernización de infraestructura de IA bajo restricciones de recursos.

El papel de Nvidia y el cambio de estrategia de chips de China

Nvidia desarrolló la GPU H20 específicamente para inferencia de IA en China, cumpliendo con las restricciones de exportación de EE.UU. Sin embargo, los reguladores chinos recientemente iniciaron una investigación sobre posibles vulnerabilidades de seguridad en el chip. Este escrutinio ha afectado la posición de mercado del chip y su adopción dentro de China.

Empresas chinas como Huawei y Cambricon están acelerando el desarrollo de GPUs domésticas para reducir la dependencia extranjera. El CEO de Nvidia declaró que la participación de mercado de la compañía para chips avanzados de IA en China ha caído a cero. Esta tendencia impulsa a los actores locales a innovar y localizar las cadenas de suministro de hardware de IA.

El nuevo enfoque de Alibaba fortalece su posición en el mercado mientras se alinea con las estrategias nacionales para la autosuficiencia tecnológica. Al reducir la dependencia de chips estadounidenses, Alibaba gana una posición más fuerte en el ecosistema de IA en evolución de China. El aumento de las acciones refleja la confianza en el ahorro de costos y la escalabilidad impulsados por la tecnología.

 

La publicación Las acciones de Alibaba Group Holding Limited (BABA) se disparan mientras la nueva tecnología de agrupación de IA reduce el uso de GPU de Nvidia en un 82% apareció primero en CoinCentral.

Oportunidad de mercado
Logo de null
Precio de null(null)
--
----
USD
Gráfico de precios en vivo de null (null)
Aviso legal: Los artículos republicados en este sitio provienen de plataformas públicas y se ofrecen únicamente con fines informativos. No reflejan necesariamente la opinión de MEXC. Todos los derechos pertenecen a los autores originales. Si consideras que algún contenido infringe derechos de terceros, comunícate a la dirección crypto.news@mexc.com para solicitar su eliminación. MEXC no garantiza la exactitud, la integridad ni la actualidad del contenido y no se responsabiliza por acciones tomadas en función de la información proporcionada. El contenido no constituye asesoría financiera, legal ni profesional, ni debe interpretarse como recomendación o respaldo por parte de MEXC.