Привет, Хабр! Я Антон, инженер по информационной безопасности в Selectel. В 2023 году Adobe расширила возможности Photoshop генеративными AI-функциями вроде GenПривет, Хабр! Я Антон, инженер по информационной безопасности в Selectel. В 2023 году Adobe расширила возможности Photoshop генеративными AI-функциями вроде Gen

Qwen-Image-Layered: будущая замена Photoshop (или нет)

2026/02/09 17:00
6м. чтение
c57416d4af03d6215b1e1f7aa94d8e88.png

Привет, Хабр! Я Антон, инженер по информационной безопасности в Selectel. В 2023 году Adobe расширила возможности Photoshop генеративными AI-функциями вроде Generative Fill — они заметно упростили редактирование сцен и отдельных объектов. Параллельно развивались и универсальные модели, работающие с изображениями вне привычных графических редакторов. Так, всего месяцем ранее Alibaba представила Tongyi Qianwen (Qwen) — семейство генеративных моделей, которое со временем вышло далеко за рамки чат-ботов.

Сегодня эти два мира пересекаются еще плотнее. Недавно Alibaba выпустила Qwen-Image-Layered — модель, предназначенную для разбиения изображения на семантические слои. В статье проверим, насколько хорошо она справляется с этой задачей на практике — на иллюстрациях и фотографиях.

Используйте навигацию, если не хотите читать текст полностью
  • Многослойность в Qwen

    • Тестирование на иллюстрации

    • Тестирование на фотографии

  • Возможные аналоги

    • Image to Layers

    • AI Layer Splitter от KomikoAI

  • Заключение

Многослойность в Qwen

Тестирование на иллюстрации

В качестве первого примера возьмем детализированную иллюстрацию с большим количеством мелких элементов, острых форм и пересечений объектов. Такие изображения обычно сложнее для автоматической сегментации, чем условно «плакатные» сцены с простыми формами и однородным фоном.

Исходное изображение c маскотом Selectel — динозавром Тирексом.
Исходное изображение.

Модель разобрала картинку на четыре слоя, но их количество можно настраивать вплоть до десяти:

Сгенерированный первый слой (фон изображения).
Первый слой (фон).
Второй слой (стол и несколько персонажей-друзей Тирекса)
Второй слой (стол и несколько персонажей-друзей Тирекса).
Третий слой (сам Тирекс с несколькими треугольниками от гирлянды).
Третий слой (сам Тирекс).
Четвертый слой (торт и его небольшие отпечатки).
Четвертый слой.

В целом модель справилась неплохо: фон с мишурой корректно вынесен в отдельный слой, основные объекты отделены друг от друга, а мелкие детали в большинстве случаев сохранены. При этом несколько треугольников мишуры с фона задублировались между слоями, что усложняет дальнейшее редактирование. Но плюс в карму модели за то, что она очистила лапы Тирекса от торта и даже поместила отпечатки в отдельный слой с тортом.

Само разбиение — лишь половина задачи. Для полноценного редактирования важно уметь менять содержимое каждого слоя или генерировать замену с сохранением стиля. Для этого в экосистеме Qwen существует отдельный инструмент — Qwen Image Edit, однако на текущий момент он не интегрирован напрямую в Layered.

Тестирование на фотографии

Для второго сценария была выбрана фотография Таймс-сквер в Нью-Йорке — сцена с большим количеством мелких деталей, пересечений объектов и разнородными слоями. Такой тип изображений традиционно сложен для автоматической семантической сегментации.

Фото Таймс-сквера в Нью-Йорке с большим количеством людей, рекламных баннеров и зданий.
Исходное фото. Источник.

В результате модель также сформировала четыре слоя:

Первый слой (фон изображения).
Первый слой (фон).
Второй слой (один из прохожих на прозрачном фоне).
Второй слой (один из прохожих).
Третий слой (несколько прохожих, выделенных по неочевидной логике).
Третий слой (несколько прохожих, выделенных по неочевидной логике).
Четвертый слой с монументом и хаотично вырезанными элементами.
Четвертый слой.

Получившиеся слои слабо соответствуют логической структуре сцены. Модель не удерживает целостность объектов: например, людей, идущих вместе, она разносит по разным слоям. В таком виде результат сложно использовать для последующего редактирования — слои не отражают ни смысловые группы, ни пространственные связи между объектами.

По итогам тестирования можно сделать вывод, что Qwen-Image-Layered неплохо справляется с разбиением относительно простых иллюстраций, но демонстрирует существенные ограничения при работе с фотографиями сложных сцен. Дополнительное ограничение — отсутствие прямой интеграции Qwen Image Edit в Layered. Для генерации или замены объектов приходится сначала работать в Image Edit, а затем вручную переносить результат в Layered, что усложняет рабочий процесс и нарушает целостность контекста.

ML Impact — про ML и AI без хайпа

Все кругом говорят про ML, но многие ли понимают его настоящую пользу для бизнеса? Мы запустили ресурс, который поможет во всем разобраться.

Подробнее →

Возможные аналоги

Насколько уникален подход Qwen-Image-Layered и есть ли у него прямые конкуренты? Среди доступных решений удалось найти лишь несколько веб-сервисов с ограниченным бесплатным доступом, которые позволяют автоматически разбивать изображение на слои. Протестируем их на тех же примерах, что и Qwen.

Image to Layers

Первый сервис — Image to Layers — представляет собой веб-инструмент для автоматического разбиения фотографий и изображений на слои. Среди ключевых особенностей — возможность дополнительно дробить полученные слои и автоматическое заполнение скрытых участков фона при разделении, что снижает количество артефактов.

Скриншот интерфейса сервиса imagetolayers.com.
Интерфейс сервиса.
Сгенерированный первый слой изображения без персонажей, обеденного стола и гирлянды.
Первый слой (фон).
Второй сгенерированный слой (Тирекс на прозрачном фоне).
Второй слой (Тирекс).
Третий сгенерированный слой (друзья Тирекса, обеденный стол и гирлянда).
Третий слой (друзья Тирекса, обеденный стол и гирлянда).
Четвертый слой (торт и небольшие артефакты вокруг).
Четвертый слой (торт и небольшие артефакты вокруг).

При тестировании на иллюстрации результат оказался сопоставимым, а в отдельных моментах — даже более аккуратным. Треугольные элементы мишуры были корректно отделены без заметных артефактов. При этом часть мелких деталей, таких как конфетти и брови персонажей, оказалась ошибочно вынесена в отдельный слой.

В целом качество генерации можно оценить немного выше по сравнению с результатом от Qwen. Но небольшой спойлер: с разделением фотографии эта модель не справилась.

Разбиение фото в интерфейсе imagetolayers.com.
Разбиение фото в интерфейсе.
Первый сгенерированный слой из фото Таймс-сквер, который на первый взгляд не многим отличается от исходника.
Первый сгенерированный слой из фото Таймс-сквер, который на первый взгляд не многим отличается от исходника.

Первый слой, который на первый взгляд не многим отличается от исходника.

Второй сгенерированный слой с двумя прохожими. Люди из семейной пары при этом разделены на несколько слоев.
Второй слой с двумя прохожими.
Третий сгенерированный слой с двумя прохожими. Люди из семейной пары при этом разделены на несколько слоев.
Третий слой с одним прохожим. При этом люди из семейной пары при этом разделены на несколько слоев

При работе с фотографией сервис продемонстрировал примерно те же ограничения. Алгоритм не сохраняет семантическую целостность объектов: людей, идущих вместе, он разделяет на разные слои, что делает результат малопригодным для дальнейшего редактирования сложных сцен.

AI Layer Splitter от KomikoAI

Второй инструмент для тестов — AI Layer Splitter (KomikoAI). Сервис позиционирует себя как универсальную платформу для генерации картинок, их анимации, раскрашивании, редактировании и разделении на слои. Доступ к функциям ограничен системой кредитов с возможностью оформления подписки.

Для теста была загружена та же иллюстрация, при этом использовалась расширенная модель, потребляющая большее количество кредитов.

Результат разбиения выглядит пугающе: «черты» персонажей были искажены, а задние лапы и нижняя часть туловища Тирекса были сгенерированы без спроса. Но в остальном модель справилась хорошо и фон вырезан — подставляй какой хочешь. Конфетти удалены — модель немного упростила себе жизнь и не стала вырезать их в отдельные слои. Сложные фигуры отделены хорошо. В сумме было получено около 20 слоев, что удобно для дальнейшего ручного редактирования и компоновки сцены.

Результат разделения картинки на слои.
Результат разделения картинки на слои.

Однако при тестировании на фотографии сервис столкнулся с теми же ограничениями, что и ранее рассмотренные решения. Вместо осмысленного разбиения сцены на логические слои результат представлял собой набор «лего-человечков», не отражающих семантическую структуру изображения. Как и в предыдущих случаях, инструмент не продемонстрировал устойчивой сегментации сложной городской сцены. Но и небольшой прогресс есть: семейная пара здесь выделена как один элемент!
Модель не перестает пугать своими генерациями, на этот раз слоев мы вообще не получили, а получили набор лего-человечков. С задачей разбиения фотографии и эта модель не справилась. Но хоть тут семейная пара была вместе! Это прогресс.

Разбиение фотографии Тайм-сквер в сервисе AI Layer Splitter от KomikoAI.
Разбиение фотографии в сервисе.
Результат разбиения на слои — автомобиль, фонарный столб, набор прохожих, а также отдельно выделенные лица и кисти рук.
Результат разбиения на слои.
a0a44775c9b940db17e0d2614c15b405.gif

Снижаем цены на выделенные серверы в реальном времени

Успейте арендовать со скидкой до 35%, пока лот не ушел другому.

Подробнее →

Заключение

Инструменты для автоматического разбиения изображений на слои пока остаются на ранней стадии развития. В ходе тестирования были заметны артефакты, несогласованность слоев и отсутствие устойчивой логики сегментации в ряде сценариев. Особенно слабо все рассмотренные решения справляются с разбиением реальных фотографий сложных сцен.

Qwen-Image-Layered демонстрирует приемлемые результаты при работе с иллюстрациями и простыми композициями. Несмотря на ограничения, его преимущество заключается в бесплатной доступности и возможности использовать в связке с Qwen Image Edit для генерации и замены отдельных элементов. Это делает его наиболее практичным вариантом среди протестированных инструментов.

Коммерческие веб-сервисы в ряде случаев показывают более аккуратное разбиение иллюстраций на отдельные элементы, однако они также не справляются с фотографиями и накладывают ограничения в виде кредитной системы и подписок.

В целом направление автоматической декомпозиции изображений выглядит перспективным и потенциально полезным для дизайнеров и разработчиков. Однако до уровня удобства и точности, который сегодня предлагает Photoshop с ручным и полуавтоматическим редактированием, таким моделям пока далеко.

Источник

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу service@support.mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

Botanix запускает stBTC для обеспечения нативной доходности Биткоина

Botanix запускает stBTC для обеспечения нативной доходности Биткоина

Пост Botanix запускает stBTC для обеспечения нативной доходности Биткоина появился на BitcoinEthereumNews.com. Botanix Labs запустила stBTC, токен для ликвидного стейкинга, разработанный для превращения Биткоина в актив, приносящий доходность, путем перераспределения сетевых комиссий за газ непосредственно пользователям. Протокол начнет накопление доходности позже на этой неделе, а его Genesis Vault планируется открыть 25 сентября с ограничением в 50 BTC. Эта инициатива является одной из первых попыток генерировать нативную доходность Биткоина без опоры на инфляционные модели токенов или централизованных хранителей. stBTC работает, позволяя пользователям депонировать Биткоин в смарт контракт Botanix без разрешений, получая токены stBTC, которые представляют их долю в стейкинг-хранилище. По мере совершения транзакций 50% сетевых комиссий за газ Botanix, оплачиваемых в BTC, возвращаются держателям stBTC. Со временем стоимость stBTC увеличивается относительно BTC, позволяя пользователям получать свой первоначальный депозит плюс доходность. Botanix оценивает, что ранняя доходность может достигать 20-50% годовых, прежде чем стабилизироваться на уровне около 6-8%, что аналогично стейкингу Ethereum, но полностью деноминировано в Биткоине. Botanix сообщает, что проверки безопасности были завершены компаниями Spearbit и Sigma Prime, а протокол построен на стандарте хранилища EIP-4626, который также лежит в основе продуктов для стейкинга на базе Ethereum. Архитектура Spiderchain компании, управляемая 16 независимыми организациями, включая Galaxy, Alchemy и Fireblocks, обеспечивает безопасность сети. Если внедрение будет расти, Botanix утверждает, что система может сделать Биткоин продуктивным, компонуемым активом для децентрализованных финансов, одновременно укрепляя консенсус сети. Это развивающаяся история. Эта статья была создана с помощью ИИ и проверена редактором Джеффри Альбусом перед публикацией. Получайте новости на свою электронную почту. Изучите информационные бюллетени Blockworks: Источник: https://blockworks.co/news/botanix-launches-stbtc
Поделиться
BitcoinEthereumNews2025/09/18 02:37
Трейдер на Hyperliquid открыл шорт с плечом 20x на 30 000 ETH на фоне роста ликвидаций

Трейдер на Hyperliquid открыл шорт с плечом 20x на 30 000 ETH на фоне роста ликвидаций

Вкратце Новый кошелёк открыл короткую позицию на 30 000 ETH с плечом 20x на Hyperliquid, ликвидация около $2 143 Ончейн-ликвидации Hyperliquid держат трейдеров ETH сфокусированными на узких маржинальных линиях
Поделиться
Coincentral2026/02/10 04:15
Litecoin и Avalanche борются за удержание поддержки, в то время как потенциал роста в 600 раз у криптовалюты ZKP увеличивает спрос на этапе 2

Litecoin и Avalanche борются за удержание поддержки, в то время как потенциал роста в 600 раз у криптовалюты ZKP увеличивает спрос на этапе 2

Криптовалютный рынок сталкивается с серьезными трудностями в начале февраля 2026 года. Волна осторожности охватила сообщество, поскольку […] Публикация Litecoin и Avalanche борются за удержание поддержки
Поделиться
Coindoo2026/02/10 04:00