DeepSeek, китайский ИИ-стартап, выпустил предварительный просмотр серии моделей V4, представляющей собой последнюю итерацию линейки больших языковых моделей компании. В анонсе представлены два варианта в рамках серии — V4-Pro и V4-Flash, — оба разработаны для балансировки производительности, эффективности и стоимости в зависимости от потребностей развёртывания.
Согласно техническому раскрытию компании, модель V4-Pro является более мощной конфигурацией, построенной примерно с 1,6 триллиона общих параметров и 49 миллиардами активных параметров. Она описывается как обеспечивающая производительность, приближающуюся к ведущим закрытым системам, особенно в таких областях, как извлечение мировых знаний, рассуждение, математика, программирование и задачи, связанные с STEM.
В сравнительных оценках, на которые ссылается разработчик, V4-Pro, как утверждается, опережает текущие модели с открытым исходным кодом по нескольким бенчмаркам, уступая лишь Google Gemini 3.1 Pro в оценках, связанных с знаниями.
Второй вариант, V4-Flash, представлен как более лёгкая и экономически эффективная альтернатива, содержащая около 284 миллиардов общих параметров и 13 миллиардов активных параметров. Несмотря на меньший масштаб, сообщается, что он сохраняет близкий паритет с версией Pro на более простых задачах на основе агентов, предлагая при этом более быстрое время отклика и сниженные операционные затраты. Эта конфигурация позиционируется для приложений с высокой пропускной способностью, где эффективность приоритетнее максимальной ёмкости модели.
DeepSeek также подчеркнул структурные и архитектурные изменения, введённые в серии V4, включая новые механизмы внимания, сочетающие сжатие на уровне токенов с методами разреженного внимания. Эти корректировки призваны улучшить эффективность обработки длинного контекста при одновременном снижении вычислительных требований и требований к памяти. Компания отмечает, что контекстное окно в один миллион токенов стало стандартом для всех её сервисов, что отражает более широкий курс на расширенную обработку контекста в крупномасштабных моделях.
Ещё одним направлением релиза является функциональность, ориентированная на агентов. Система V4 оптимизирована для совместимости с внешними экосистемами инструментов ИИ, включая такие фреймворки, как Claude Code и OpenClaw, а также другие среды разработки на основе агентов. Модель также описывается как активно используемая во внутренних рабочих процессах агентного программирования.
Как V4-Pro, так и V4-Flash доступны через API, поддерживая несколько стандартов интеграции и двойные режимы работы. Компания указала, что устаревшие модели будут постепенно выведены из эксплуатации в пользу новой архитектуры в предстоящем цикле, а полная миграция ожидается к середине 2026 года.
Материал DeepSeek представляет серию моделей V4: мощный ИИ с высокими параметрами нацелен на эффективность и передовую производительность впервые опубликован на Metaverse Post.


