Darius Baruo
19:09, 02 дек 2025
NVIDIA представляет Mistral 3, новую линейку ИИ-моделей, предлагающую непревзойденную точность и эффективность. Оптимизированные для графических процессоров NVIDIA, эти модели улучшают развертывание ИИ во всех отраслях.
NVIDIA представила свое новейшее семейство ИИ-моделей, Mistral 3, обещающее беспрецедентную точность и эффективность для разработчиков и предприятий. Как сообщается в блоге разработчиков NVIDIA, эти модели оптимизированы для развертывания на графических процессорах NVIDIA, от высокопроизводительных центров обработки данных до периферийных платформ.
Семейство моделей Mistral 3
Семейство Mistral 3 включает разнообразный набор моделей, адаптированных для различных приложений. Оно представляет крупномасштабную разреженную мультимодальную и многоязычную модель с 675 миллиардами параметров, наряду с меньшими, плотными моделями, называемыми Ministral 3, доступными в размерах 3B, 8B и 14B параметров. Каждый размер модели представлен в трех вариантах: Base, Instruct и Reasoning, что в общей сложности дает девять моделей.
Эти модели обучены на графических процессорах NVIDIA Hopper и доступны через Mistral AI на Hugging Face. Разработчики могут развертывать эти модели, используя различные форматы точности моделей и фреймворки с открытым исходным кодом, обеспечивая совместимость с различными графическими процессорами NVIDIA.
Производительность и оптимизация
Модель NVIDIA Mistral Large 3 достигает выдающейся производительности на платформе GB200 NVL72, используя набор оптимизаций, адаптированных для больших моделей смеси экспертов (MoE). С улучшением производительности до 10 раз по сравнению с предыдущими поколениями, модель Mistral Large 3 демонстрирует значительные улучшения в пользовательском опыте, экономической эффективности и энергопотреблении.
Этот прирост производительности обусловлен технологией NVIDIA TensorRT-LLM Wide Expert Parallelism, выводом с низкой точностью с использованием NVFP4 и фреймворком NVIDIA Dynamo, который повышает производительность для рабочих нагрузок с длинным контекстом.
Периферийное развертывание и универсальность
Модели Ministral 3, разработанные для периферийного развертывания, предлагают гибкость и производительность для ряда приложений. Эти модели оптимизированы для NVIDIA GeForce RTX AI PC, DGX Spark и платформ Jetson. Локальная разработка выигрывает от ускорения NVIDIA, обеспечивая высокую скорость вывода и улучшенную конфиденциальность данных.
Разработчики Jetson, в частности, могут использовать контейнер vLLM для достижения эффективной обработки токенов, что делает эти модели идеальными для периферийных вычислительных сред.
Будущие разработки и сообщество открытого исходного кода
В перспективе NVIDIA планирует дальнейшее улучшение моделей Mistral 3 с предстоящими оптимизациями производительности, такими как спекулятивное декодирование. Кроме того, сотрудничество NVIDIA с сообществами открытого исходного кода, такими как vLLM и SGLang, направлено на расширение интеграции ядер и поддержки параллелизма.
С этими разработками NVIDIA продолжает поддерживать сообщество ИИ с открытым исходным кодом, предоставляя надежную платформу для разработчиков для эффективного создания и развертывания ИИ-решений. Модели Mistral 3 доступны для загрузки на Hugging Face или могут быть протестированы непосредственно через платформу сборки NVIDIA.
Источник изображения: Shutterstock
Источник: https://blockchain.news/news/nvidia-mistral-3-models-boost-ai-efficiency


