Alibaba Group Holding Limited закрылась на уровне 167,05 $, отметив рост на 1,19%, после крупного прорыва в инфраструктуре ИИ.
Alibaba Group Holding Limited, BABA
Компания представила решение для объединения вычислений, которое сократило использование GPU Nvidia на 82% в операциях обслуживания моделей. Это достижение выводит Alibaba Cloud вперед в гонке за оптимизацию развертывания ИИ в масштабе.
Alibaba Cloud, подразделение облачных вычислений компании из Ханчжоу, внедрило новую систему под названием Aegaeon для повышения эффективности ИИ. Решение позволяет одному GPU Nvidia H20 обслуживать до семи больших языковых моделей одновременно. Это изменение сократило использование GPU с 1 192 до всего 213 единиц во время внутреннего тестирования.
Aegaeon работает, выполняя автоматическое масштабирование на уровне токенов во время вывода модели для параллельных рабочих нагрузок ИИ. Эта стратегия обеспечивает динамическое перераспределение ресурсов, позволяя одному и тому же GPU переключаться между моделями в процессе обработки. Это также сократило задержку в задачах переключения моделей на 97%.
Решение проходило бета-тестирование более трех месяцев на торговой площадке Bailian от Alibaba Cloud. Оно обрабатывало десятки моделей с параметрами до 72 миллиардов без ухудшения качества обслуживания. Теперь Aegaeon официально развернут на торговой площадке моделей Alibaba, которая обслуживает собственные модели Qwen.
Alibaba Cloud обнаружила, что только небольшое количество моделей часто используется в реальных задачах ИИ. Несмотря на это, многие GPU были выделены для редко вызываемых моделей, что привело к низкому использованию ресурсов. Данные показали, что 17,7% GPU обслуживали всего 1,35% от общего количества запросов на вывод.
С помощью Aegaeon компания устранила этот дисбаланс через стратегии объединения и интеллектуального масштабирования. Система обеспечила постоянное использование GPU и предотвратила простаивание процессов для редко используемых моделей. Alibaba достигла более высокой пропускной способности и улучшила эффективность оборудования для корпоративных развертываний.
Исследователи Пекинского университета и Alibaba Cloud совместно написали техническую статью, детализирующую инновацию, представленную на SOSP 2025 в Южной Корее. Исследование подчеркнуло, что обслуживание параллельных рабочих нагрузок традиционными методами GPU влекло за собой ненужные затраты. Этот прорыв напрямую поддерживает цель Китая по модернизации инфраструктуры ИИ в условиях ограниченных ресурсов.
Nvidia разработала GPU H20 специально для вывода ИИ в Китае, соблюдая экспортные ограничения США. Однако китайские регуляторы недавно начали расследование возможных уязвимостей безопасности бэкдора в чипе. Эта проверка повлияла на рыночную позицию чипа и его внедрение в Китае.
Китайские компании, такие как Huawei и Cambricon, ускоряют разработку отечественных GPU для снижения зависимости от иностранных поставщиков. Генеральный директор Nvidia заявил, что доля рынка компании для передовых чипов ИИ в Китае упала до нуля. Эта тенденция подталкивает местных игроков к инновациям и локализации цепочек поставок оборудования для ИИ.
Новый подход Alibaba укрепляет ее рыночную позицию, соответствуя национальным стратегиям технологической самодостаточности. Сокращая зависимость от американских чипов, Alibaba получает более прочную позицию в развивающейся экосистеме ИИ Китая. Рост акций отражает уверенность в экономии затрат и масштабируемости, обусловленных технологиями.
Пост "Акции Alibaba Group Holding Limited (BABA) растут, поскольку новая технология объединения ИИ сокращает использование GPU Nvidia на 82%" впервые появился на CoinCentral.



