TLDR Alibaba сокращает использование GPU на 82% с помощью Aegaeon, обеспечивая работу ИИ в массовом масштабе. Aegaeon снижает задержку переключения моделей ИИ на 97%, повышая производительность. Один GPU Nvidia H20 теперь запускает 7 LLM одновременно в рамках обновления ИИ Alibaba. Alibaba Cloud повышает эффективность GPU с помощью автоматического масштабирования на уровне токенов. Aegaeon обеспечивает достижение целей Китая в области ИИ, сокращая зависимость от чипов Nvidia. [...] Сообщение о том, что акции Alibaba Group Holding Limited (BABA) взлетели, поскольку новая технология объединения ИИ сокращает использование GPU Nvidia на 82%, впервые появилось на CoinCentral.TLDR Alibaba сокращает использование GPU на 82% с помощью Aegaeon, обеспечивая работу ИИ в массовом масштабе. Aegaeon снижает задержку переключения моделей ИИ на 97%, повышая производительность. Один GPU Nvidia H20 теперь запускает 7 LLM одновременно в рамках обновления ИИ Alibaba. Alibaba Cloud повышает эффективность GPU с помощью автоматического масштабирования на уровне токенов. Aegaeon обеспечивает достижение целей Китая в области ИИ, сокращая зависимость от чипов Nvidia. [...] Сообщение о том, что акции Alibaba Group Holding Limited (BABA) взлетели, поскольку новая технология объединения ИИ сокращает использование GPU Nvidia на 82%, впервые появилось на CoinCentral.

Акции Alibaba Group Holding Limited (BABA) взлетают, поскольку новая технология объединения ИИ сокращает использование GPU Nvidia на 82%

2025/10/18 20:15
3м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

TLDR

  • Alibaba сокращает использование GPU на 82% с помощью Aegaeon, обеспечивая ИИ в массовом масштабе.
  • Aegaeon сокращает задержку переключения моделей ИИ на 97%, повышая производительность.
  • Один GPU Nvidia H20 теперь запускает 7 LLM одновременно в рамках обновления ИИ Alibaba.
  • Alibaba Cloud повышает эффективность GPU с помощью автоматического масштабирования на уровне токенов.
  • Aegaeon поддерживает цели Китая в области ИИ, сокращая зависимость от чипов Nvidia.

Alibaba Group Holding Limited закрылась на уровне 167,05 $, отметив рост на 1,19%, после крупного прорыва в инфраструктуре ИИ.

BABA Stock Card

Alibaba Group Holding Limited, BABA

Компания представила решение для объединения вычислений, которое сократило использование GPU Nvidia на 82% в операциях обслуживания моделей. Это достижение выводит Alibaba Cloud вперед в гонке за оптимизацию развертывания ИИ в масштабе.

Aegaeon повышает эффективность, сокращает зависимость от GPU

Alibaba Cloud, подразделение облачных вычислений компании из Ханчжоу, внедрило новую систему под названием Aegaeon для повышения эффективности ИИ. Решение позволяет одному GPU Nvidia H20 обслуживать до семи больших языковых моделей одновременно. Это изменение сократило использование GPU с 1 192 до всего 213 единиц во время внутреннего тестирования.

Aegaeon работает, выполняя автоматическое масштабирование на уровне токенов во время вывода модели для параллельных рабочих нагрузок ИИ. Эта стратегия обеспечивает динамическое перераспределение ресурсов, позволяя одному и тому же GPU переключаться между моделями в процессе обработки. Это также сократило задержку в задачах переключения моделей на 97%.

Решение проходило бета-тестирование более трех месяцев на торговой площадке Bailian от Alibaba Cloud. Оно обрабатывало десятки моделей с параметрами до 72 миллиардов без ухудшения качества обслуживания. Теперь Aegaeon официально развернут на торговой площадке моделей Alibaba, которая обслуживает собственные модели Qwen.

Аналитика рынка моделей и оптимизация производительности

Alibaba Cloud обнаружила, что только небольшое количество моделей часто используется в реальных задачах ИИ. Несмотря на это, многие GPU были выделены для редко вызываемых моделей, что привело к низкому использованию ресурсов. Данные показали, что 17,7% GPU обслуживали всего 1,35% от общего количества запросов на вывод.

С помощью Aegaeon компания устранила этот дисбаланс через стратегии объединения и интеллектуального масштабирования. Система обеспечила постоянное использование GPU и предотвратила простаивание процессов для редко используемых моделей. Alibaba достигла более высокой пропускной способности и улучшила эффективность оборудования для корпоративных развертываний.

Исследователи Пекинского университета и Alibaba Cloud совместно написали техническую статью, детализирующую инновацию, представленную на SOSP 2025 в Южной Корее. Исследование подчеркнуло, что обслуживание параллельных рабочих нагрузок традиционными методами GPU влекло за собой ненужные затраты. Этот прорыв напрямую поддерживает цель Китая по модернизации инфраструктуры ИИ в условиях ограниченных ресурсов.

Роль Nvidia и изменение стратегии Китая в отношении чипов

Nvidia разработала GPU H20 специально для вывода ИИ в Китае, соблюдая экспортные ограничения США. Однако китайские регуляторы недавно начали расследование возможных уязвимостей безопасности бэкдора в чипе. Эта проверка повлияла на рыночную позицию чипа и его внедрение в Китае.

Китайские компании, такие как Huawei и Cambricon, ускоряют разработку отечественных GPU для снижения зависимости от иностранных поставщиков. Генеральный директор Nvidia заявил, что доля рынка компании для передовых чипов ИИ в Китае упала до нуля. Эта тенденция подталкивает местных игроков к инновациям и локализации цепочек поставок оборудования для ИИ.

Новый подход Alibaba укрепляет ее рыночную позицию, соответствуя национальным стратегиям технологической самодостаточности. Сокращая зависимость от американских чипов, Alibaba получает более прочную позицию в развивающейся экосистеме ИИ Китая. Рост акций отражает уверенность в экономии затрат и масштабируемости, обусловленных технологиями.

 

Пост "Акции Alibaba Group Holding Limited (BABA) растут, поскольку новая технология объединения ИИ сокращает использование GPU Nvidia на 82%" впервые появился на CoinCentral.

Возможности рынка
Логотип null
null Курс (null)
--
----
USD
График цены null (null) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.