Полностью самостоятельная разработка LLM дело дорогое, требующее высококвалифицированных кадров (математиков и инженеров), высокопроизводительного оборудования (графических ускорителей, быстрой памяти и процессоров), и, самое главное, наличие школы. Часто эффективные менеджеры недооценивают необходимость опыта в разработке и производстве чего-либо. Наличие желания и денег не всегда приводит к нужному результату.
В этой статье я рассмотрю возможное развитие национальной LLM со своей точки зрения, которая, как вы понимаете, может быть ошибочной, либо меняться под давлением обстоятельств.
На сегодня страны, которые успешно разработали и широко эксплуатируют свои LLM, можно пересчитать по пальцам — в топах США и Китай. Вторая лига — Франция, Южная Корея. Есть страны, в которых плотно работают с суверенными моделями (Япония, Индия и т.д.), здесь граница с лидерами достаточно размыта. Во многих странах созданы и работают национальные LLM, обычно на базе какого-либо университета или центра, но говорить об их широком использовании и, соответственно, оценить уровень качества достаточно сложно. Россия, как всегда, особый случай.
Сейчас государственная политика России в области развития ИИ базируется на двух документах: Указ Президента Российской Федерации “О развитии искусственного интеллекта в Российской Федерации” №490 от 10.10.2019 и Постановление Правительства Российской Федерации от 9 июня 2025 г. N 861 "О Центре развития искусственного интеллекта при Правительстве Российской Федерации". Эти два документа достаточно внятно демонстрируют, что государство озабочено отставанием в развитии нейросетей, понимает причины, и готово помочь в масштабировании реальных проектов. При этом фактически снимает с себя обязанность самостоятельно разработать и эксплуатировать национальную LLM c нуля, оставляя это крупным корпорациям. Честно говоря, я этот подход поддерживаю. Например, в Казахстане работает национальная КазLLM, разработанная Институтом умных систем и искусственного интеллекта (ISSAI). Но буквально недавно этот проект был раскритикован на самом высоком уровне, президент Казахстана задал вопрос о проблемах развития национальной LLM, и её популярности у жителей.
Как всегда существует мнение, что все всё делают неправильно, на самом деле путь к AGI совершенно другой. Для таких мыслителей созданный Центр развития искусственного интеллекта стал шансом на реализацию собственных идей.
Полагаю, что уже сейчас Центр столкнулся с тысячами заявок на приоритетное внедрение разного рода оригинальных ИИ. Уверен, каждая такая заявка включает обстоятельный анализ кризиса LLM, безусловность тупика западного ИИ-строения. С другой стороны обязательно будет упомянуто, что отставание от Запада имеет экзистенциальный характер, и нужно что-то срочно делать.
При этом сами концепции выглядят серьезно, подкреплены патентами и научными регалиями авторов. Возможно, чиновники даже попытаются разобраться в парочке (или найти для этого специалистов), но эти концепции потому и прорывные, что разобраться в них невозможно. Я хотел привести типовые примеры, но крайне сложно их типизировать, фантазия человека безгранична. Впрочем, ключевые термины — резонанс, поле, графы, магические свойства избранных чисел (3, 6, 8, 7, 12, 13, 18 и т.д.), со-знание, с-мысл и ра-з-ум, устойчивость, автономность, саморазвитие, гиперплоскости и матаппарат, требующий годы работы математика уровня Перельмана.
Даже если чиновники честно попытаются разобраться в этом потоке идей, найти здравое зерно будет невозможно. Именно поэтому здравомыслящие люди включили в положение Центра правило, что его действие не распространяется на фундаментальные и прикладные научные исследования, а также на образование. При этом в функции Центра входит «разработка и тиражирование решений» на базе ИИ. То есть, ребята, когда сделаете, приходите показывать, поможем развить. Проблема в том, что чтобы показать проект, нужно его реализовать в ПО и железе, а у авторов денег нет. Впрочем, учитывая тысячи идей и дефицит ресурсов, вынужден буду согласиться, пока авторы не реализуют хоть как-то свои мысли, давать государственные деньги нет смысла.
И вполне логичная для чиновника мысль — если в этих концепциях есть здравое зерно, они бы давно были реализованы на Западе. Тот же символьный ИИ, попытки его реализовать столкнулись с принципиальными ограничениями, и не помогли никакие инвестиции. У нас же каждая вторая идея это перепев символьного ИИ с добавлением эзотерики, или Задорнова, или квантов (чтобы под этим не понимали авторы).
Основная масса разработчиков ИИ в России это, конечно, разного рода оптимизаторы опенсорсных моделей, единственные, кто выделяется это, естественно, GigaChat (Сбер) и Алиса (Яндекс). При этом, если представители Сбера утверждают, что GigaChat 3.0 полностью самостоятельная разработка, то представители Яндекса не скрывают, что в пайплайн обучения своей модели включено использование весов Qwen.
Цитата представителя Яндекс:
Причины использования опенсорса понятны, Яндекс прямо говорит:
Сокращение длительности экспериментов в 20 раз, это не просто сокращение времени. Стабильная база снижает риски на всех последующих этапах: меньше нестабильных прогонов, быстрее сходимость, меньше отладки. Реальная экономия на персонале, железе и электроэнергии существенно выше, чем кажется на первый взгляд. Даже корпорации уровня Яндекса вынуждены это учитывать.
Проблема в том, что такое сокращение расходов имеет и негативный момент, который часто недооценивают. У инженеров не нарабатывается опыт, отсутствует накопленная культура экспериментов, цепочка ошибок и исправлений в разработке LLM с нуля. Как результат, мы молчаливо соглашаемся с тем, что наша LLM всегда будет на уровне около лучшего опенсорса.
Сбер осенью 2025 года выкатил открытые веса GigaChat 3.0 С учетом того, что это их полностью собственная разработка, это очень здорово. Проблема в том, что эта модель до сих пор отсутствует в публичном инференсе, то есть, попробовать могут лишь счастливые обладатели достойного железа. Поскольку я к таким не отношусь, сказать о качестве этой модели я ничего не могу. Но сам факт этого отсутствия говорит о наличии проблем. Хотя разработчики говорят о продолжающемся дообучении модели, я полагаю, что всё дело в отсутствии серверных мощностей. И, учитывая реплику Яндекса о 20-кратной экономии при использовании чужих весов, похоже эта проблема критична в условиях России.
Нужно учесть, что там где условный Anthropic сможет провести 100 экспериментов, в условиях нехватки мощностей можно будет провести пять или десять, что неизбежно будет увеличивать отставание в качестве ИИ.
Так какие же перспективы у флагманской ЛЛМ в России. Честно говоря, возможности предоставления общего доступа к нейросети уровня топов США я не вижу. У государства и корпораций просто нет стимула (и денег) финансировать такую благотворительность. Можете оценить уровень опенсорса, и примерно такое вы и сможете получить.
Но, обратите внимание на важное для понимания перспективы условие, все зарубежные проприетарные LLM фактически не имеют права работать на территории РФ, так как не хранят персональные данные на территории России. Кроме того, государство делит модели ИИ на отечественные и доверенные. Отечественные — модели, использующие опенсорс, доверенные полностью созданные самостоятельно. При этом только доверенные модели могут использоваться в государственных органах и критичных отраслях (понятие очень растяжимое). Именно поэтому разработчики регулярно обращают внимание на самостоятельность разработки.
То есть миллиарды рублей, вложенные в разработку собственной LLM, возможно компенсировать за счёт оказания услуг государству и платежеспособным компаниям. В этом будет способствовать и установление обязательных показателей для государственных организаций и корпораций по внедрению ИИ в свою деятельность.
Очень заманчиво, конечно, вовлечь в поток денежных средств и население, но пока есть хоть какой-то доступ к Claude, Gemini, ChatGPT, Deepseek и т.д. это очень сложно.
Ещё один вариант, это разработка специализированных инструментов на базе LLM. Этим, кстати, очень плотно занимается и Сбер, и Яндекс. В этом случае недостаток общего уровня компенсируется логикой конкретной задачи. Медицина, транспорт, CRM, картинки, боты в поддержке и так далее. Более того, возможно это единственный шанс на достойную монетизацию своих разработок.
Но здесь большая конкуренция со стороны независимых разработчиков, которые вполне успешно работают с опенсорсными моделями. С одной стороны, это очень хорошо для конкуренции и прогресса, с другой стороны, возникает соблазн слегка расширить понятие критичных отраслей, и решить вопрос поддержки доверенных LLM.
Флагманская LLM в России, я считаю, вполне реальна. Другой вопрос, не стоит требовать от нее сопоставимого с нейросетями за миллиарды долларов уровня, и скорее всего она будет доступна далеко не всем, но основные потребности среднего пользователя такая LLM закроет вполне успешно.
Источник


