Подробно описывает конвейер O3D-SIM для VLN. Он извлекает информацию о семантических экземплярах открытого типа (маски, функции CLIP/DINO) из RGB-D изображенийПодробно описывает конвейер O3D-SIM для VLN. Он извлекает информацию о семантических экземплярах открытого типа (маски, функции CLIP/DINO) из RGB-D изображений

Семантическое извлечение экземпляров: функции CLIP и DINO для 3D-картирования

2025/12/11 03:00
2м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

Резюме и 1 Введение

  1. Связанные работы

    2.1. Навигация на основе зрения и языка

    2.2. Семантическое понимание сцены и сегментация экземпляров

    2.3. Реконструкция 3D-сцены

  2. Методология

    3.1. Сбор данных

    3.2. Семантическая информация открытого набора из изображений

    3.3. Создание 3D-представления открытого набора

    3.4. Навигация на основе языка

  3. Эксперименты

    4.1. Количественная оценка

    4.2. Качественные результаты

  4. Заключение и будущая работа, Заявление о раскрытии информации и Ссылки

3. Методология

В этом разделе мы обсуждаем конвейер нашего метода навигации на основе зрения и языка (VLN), который использует O3D-SIM. Мы начинаем с обзора предлагаемого конвейера, а затем представляем глубокий анализ его составных этапов. Начальная фаза нашей методологии включает сбор данных, состоящий из набора RGB-D изображений и внешних и внутренних параметров камеры, которые описаны в первую очередь. Впоследствии мы переходим к созданию Семантической карты экземпляров 3D открытого набора. Этот процесс разделен на два основных этапа: изначально мы извлекаем информацию о семантических экземплярах открытого набора из изображений; после этого мы используем собранную информацию открытого набора для организации 3D-облака точек в семантическую карту экземпляров 3D открытого набора. Заключительная часть нашего обсуждения фокусируется на модуле VLN, где мы говорим о его реализации и функциональности.

\ Конвейер создания O3D-SIM изображен на Рис.2. Первым шагом создания O3D-SIM, представленным в Разделе 3.2, является извлечение семантической информации экземпляров открытого набора из RGB-последовательности входных изображений. Эта информация включает для каждого экземпляра объекта информацию о маске и семантические характеристики, представленные встраиваемыми характеристиками CLIP [9] и DINO [10]. Второй шаг, представленный в Разделе 3.3, использует эту семантическую информацию экземпляров открытого набора для кластеризации входного 3D-облака точек в семантическую карту 3D-объектов открытого набора, см. Рисунки 2 и 3. Операция улучшается постепенно путем применения последовательности RGB-D изображений с течением времени.

\

:::info Авторы:

(1) Лакш Нанвани, Международный институт информационных технологий, Хайдарабад, Индия; этот автор внес равный вклад в эту работу;

(2) Кумарадитья Гупта, Международный институт информационных технологий, Хайдарабад, Индия;

(3) Адитья Матур, Международный институт информационных технологий, Хайдарабад, Индия; этот автор внес равный вклад в эту работу;

(4) Свайям Агравал, Международный институт информационных технологий, Хайдарабад, Индия;

(5) А.Х. Абдул Хафез, Университет Хасана Кальонджу, Шахинбей, Газиантеп, Турция;

(6) К. Мадхава Кришна, Международный институт информационных технологий, Хайдарабад, Индия.

:::


:::info Эта статья доступна на arxiv по лицензии CC by-SA 4.0 Deed (Attribution-Sharealike 4.0 International).

:::

\

Возможности рынка
Логотип OpenLedger
OpenLedger Курс (OPEN)
$0,14326
$0,14326$0,14326
-1,09%
USD
График цены OpenLedger (OPEN) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

Победитель определён на праймериз Республиканской партии в Сенат, поскольку республиканцы борются за сохранение контроля над Северной Каролиной

Победитель определён на праймериз Республиканской партии в Сенат, поскольку республиканцы борются за сохранение контроля над Северной Каролиной

По данным The Associated Press, республиканцы, как ожидается, выбрали Майкла Уотли своим кандидатом на выборы в Сенат Северной Каролины во вторник вечером
Поделиться
Rawstory2026/03/04 09:47
Трамп усиливает давление на банки на фоне торможения закона CLARITY

Трамп усиливает давление на банки на фоне торможения закона CLARITY

Президент Дональд Трамп публично раскритиковал банковский сектор США за его противодействие законодательству о структуре криптовалютного рынка, обостряя то, что
Поделиться
Brave New Coin2026/03/04 09:37
Превзойдя минимумы эпохи FTX: 38% альткоинов достигли рекордных минимумов на фоне ухода ликвидности с криптовалютной периферии

Превзойдя минимумы эпохи FTX: 38% альткоинов достигли рекордных минимумов на фоне ухода ликвидности с криптовалютной периферии

Альткоины переживают продолжительный структурный спад с пика бычьего цикла 2021 года. В то время как Bitcoin смог сохранить часть своего макротренда,
Поделиться
NewsBTC2026/03/04 09:00