Netflix выпустил VOID — open-source AI-фреймворк, который удаляет объекты из видео, сохраняя при этом реалистичные физические взаимодействия. Пост Netflix UnveilsNetflix выпустил VOID — open-source AI-фреймворк, который удаляет объекты из видео, сохраняя при этом реалистичные физические взаимодействия. Пост Netflix Unveils

Netflix представляет VOID: фреймворк с открытым исходным кодом для физически согласованного удаления объектов из видео

2026/04/06 21:34
2м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com
Netflix запускает VOID — открытый AI-фреймворк для физически согласованного удаления объектов из видео

Глобальный стриминговый сервис Netflix представил VOID — открытый фреймворк, предназначенный для удаления объектов из видео с сохранением физических взаимодействий, которые они создают, решая ограничения, присущие традиционным инструментам закрашивания и удаления объектов.

Исторически удаление объекта из сцены было простой задачей, но обеспечение реалистичного поведения окружения впоследствии представляло значительные трудности. Например, удаление человека, держащего гитару, оставляет инструмент неестественно подвешенным, а удаление ныряльщика из бассейна может оставить воду неподвижной. Команды визуальных эффектов традиционно исправляли такие проблемы вручную — трудоемкий процесс, который может растянуться от дней до недель для одной сцены.

VOID, сокращение от Video Object and Interaction Deletion, предназначен для решения этих сложностей. В отличие от традиционных методов, которые просто заполняют отсутствующие пиксели, система прогнозирует физически согласованные результаты для сцены после удаления объекта. 

Для этого используется комбинация технологий. Gemini от Google анализирует сцену, чтобы определить области, которые будут затронуты удалением, в то время как SAM2 от Meta сегментирует объекты для удаления. Эти выходные данные кодируются в квадмаску — карту с четырьмя значениями, указывающую, какие области стереть, какие перекрываются, какие физически затронуты, а какие остаются нетронутыми. Модель видеодиффузии, построенная на базе CogVideoX от Alibaba, затем реконструирует сцену физически правдоподобным образом. Необязательный второй проход применяет оптический поток для исправления любых искажений от первоначальной реконструкции.

Демонстрация физически согласованного удаления объектов в видеопроизводстве 

Демонстрации VOID показывают впечатляющие результаты: воздушные шары естественно поднимаются, когда держатель удален, блоки сохраняют стабильность, когда несвязанные блоки удалены, и поверхность бассейна остается незатронутой после удаления человека. В исследовании предпочтений с участием 25 человек VOID был выбран в 64,8 процента случаев, превзойдя Runway — ведущую коммерческую альтернативу, которая достигла лишь 18,4 процента.

Этот релиз знаменует собой первый публично доступный AI-инструмент Netflix Research. Лицензированный под Apache 2.0, VOID может использоваться в коммерческих целях и размещен на Hugging Face. Аппаратные требования в настоящее время ограничивают доступ — для запуска модели требуется GPU с 40 ГБ VRAM, но будущие оптимизации и снижение инфраструктурных затрат могут расширить доступность. VOID представляет собой сдвиг в технологии видеопроизводства, переходя от простых инструментов стирания к системам, способным понимать и реалистично реконструировать сцены — разработка со значительными последствиями для профессиональных рабочих процессов.

Пост Netflix представляет VOID: открытый фреймворк для физически согласованного удаления объектов из видео впервые появился на Metaverse Post.

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

30 000$ в PRL + 15 000 USDT

30 000$ в PRL + 15 000 USDT30 000$ в PRL + 15 000 USDT

Вносите депозит и торгуйте PRL для роста наград!