Компания Google официально представила Nano Banana 2 — свою новейшую модель для генерации изображений, работающую на базе искусственного интеллекта Gemini. Разработчики позиционируют новинку как инструмент, обеспечивающий более быстрое создание визуального контента с улучшенным качеством интеллектуальной обработки, точным отображением текста и расширенными возможностями для творческого контроля.
Система, техническое название которой звучит как Gemini 3.1 Flash Image, объединяет в себе высокую скорость работы, присущую модели Gemini Flash, и углублённые способности к анализу и пониманию мира, ранее доступные в версии Nano Banana Pro. Главная цель создателей — предложить пользователям возможность получать визуальные материалы студийного уровня без потери времени на генерацию.
Предыдущая версия, Nano Banana, приобрела популярность в прошлом году благодаря своим функциям редактирования и создания изображений. Вышедшая несколько месяцев спустя более продвинутая версия Pro добавила к этим возможностям улучшенную фактическую достоверность и творческую точность. С выходом Nano Banana 2 Google объединяет лучшие качества обеих предшествующих моделей в едином, более быстром решении для широкого круга задач.
Ключевым отличием новинки является её опора на обширную базу знаний Gemini. Модель способна использовать актуальную информацию и изображения из веб-поиска, что позволяет ей значительно точнее отображать конкретные объекты и сюжеты. Это расширенное понимание контекста открывает возможности для создания инфографики, преобразования заметок в схемы и визуализации данных с высокой степенью достоверности.
Особое внимание в Nano Banana 2 уделено балансу между скоростью и качеством. Google утверждает, что модель значительно сокращает разрыв между быстрой и высокоточной генерацией. В системе реализована улучшенная функция сохранения идентичности объектов: теперь в рамках одного рабочего процесса можно поддерживать сходство персонажей (до пяти одновременно) и сохранять точное воспроизведение до четырнадцати различных объектов. Это особенно актуально при создании раскадровок и многосценных повествований, позволяя избежать визуальных искажений.
Значительно улучшилось и следование инструкциям. Новая модель более строго придерживается сложных и многосоставных запросов, стремясь уловить все нюансы вместо их приблизительной интерпретации. Пользователи могут гибко настраивать соотношение сторон и разрешение итогового изображения — от 512 пикселей до 4K, что делает инструмент одинаково полезным как для создания вертикальных постов в социальных сетях, так и для материалов, предназначенных для широкоформатных дисплеев.
Отдельным направлением работы стала генерация и перевод текста внутри изображений. Nano Banana 2 способна создавать четкие и легко читаемые надписи для маркетинговых макетов, поздравительных открыток или дизайнерских прототипов. Более того, модель может переводить и адаптировать текст непосредственно на изображении, что существенно упрощает работу с глобальным контентом.
Распространение Nano Banana 2 началось на множестве платформ Google. В приложении Gemini она заменила собой модель Nano Banana Pro в режимах Fast, Thinking и Pro. При этом подписчики Google AI Pro и Ultra по-прежнему смогут обращаться к версии Pro для решения специализированных задач. Новая модель также интегрирована в поиск (через AI Mode и Lens), AI Studio и API Gemini, платформу Vertex AI на Google Cloud, а также в сервисы Flow, Google Ads и Google Antigravity. В частности, в Flow она становится основной моделью для генерации изображений, доступной пользователям без дополнительной платы.
Параллельно с творческими улучшениями Google продолжает развивать системы подтверждения происхождения контента. Компания продолжает использовать технологию водяных знаков SynthID совместно со стандартом C2PA Content Credentials, чтобы пользователи могли точно определять, как и с помощью каких инструментов было создано или изменено то или иное изображение. С момента запуска в ноябре функция верификации SynthID внутри приложения Gemini применялась более 20 миллионов раз для идентификации видео, аудио и изображений, созданных ИИ от Google. Компания также анонсировала скорое добавление поддержки C2PA непосредственно в приложение Gemini.
С запуском Nano Banana 2 Google переводит быструю и достоверную генерацию изображений из категории премиальных дополнений в разряд стандартных возможностей, что сигнализирует об ужесточении конкуренции на рынке высокоскоростных инструментов для творчества на базе искусственного интеллекта.
Источник


