В данной статье представлена структура для оценки репрезентативного смещения в моделях рекомендаций с латентными факторами (LFR), с акцентом на то, как вложения пользователей и элементов могут кодировать неявные ассоциации с чувствительными атрибутами, такими как пол. В отличие от предыдущих исследований, сосредоточенных на показателях производительности или смещении экспозиции, эта работа исследует смещение ассоциаций атрибутов и демонстрирует его измерение через отраслевое исследование рекомендаций подкастов. Цель состоит в том, чтобы помочь практикам проводить аудит, интерпретировать и смягчать распространение смещения в многоэтапных конвейерах рекомендаций, способствуя большей справедливости и прозрачности в системах ИИ.В данной статье представлена структура для оценки репрезентативного смещения в моделях рекомендаций с латентными факторами (LFR), с акцентом на то, как вложения пользователей и элементов могут кодировать неявные ассоциации с чувствительными атрибутами, такими как пол. В отличие от предыдущих исследований, сосредоточенных на показателях производительности или смещении экспозиции, эта работа исследует смещение ассоциаций атрибутов и демонстрирует его измерение через отраслевое исследование рекомендаций подкастов. Цель состоит в том, чтобы помочь практикам проводить аудит, интерпретировать и смягчать распространение смещения в многоэтапных конвейерах рекомендаций, способствуя большей справедливости и прозрачности в системах ИИ.

Выявление скрытых отклонений в системах рекомендаций ИИ

2025/11/11 02:54

Аннотация

1 Введение

2 Связанные работы

2.1 Справедливость и предвзятость в рекомендациях

2.2 Количественная оценка гендерных ассоциаций в представлениях обработки естественного языка

3 Постановка проблемы

4 Методология

4.1 Область применения

4.3 Флаг

5 Практический пример

5.1 Область применения

5.2 Реализация

5.3 Флаг

6 Результаты

6.1 Визуализации латентного пространства

6.2 Направления предвзятости

6.3 Метрики усиления предвзятости

6.4 Сценарии классификации

7 Обсуждение

8 Ограничения и будущая работа

9 Заключение и ссылки

\

3 Постановка проблемы

Исследования разделенных латентных факторных рекомендаций становятся все более популярными, поскольку было показано, что алгоритмы LFR запутывают атрибуты модели в результирующих обученных пользовательских и элементных вложениях, что приводит к нестабильным и неточным результатам рекомендаций [44, 58, 62, 65]. Однако большинство этих исследований ориентированы на результат, предоставляя методы смягчения для улучшения производительности, но не решая проблему потенциальной предвзятости представления в латентном пространстве. В результате лишь немногие существующие методы оценки анализируют, как атрибуты явно (из-за отдельного использования в качестве атрибута модели) или неявно фиксируются в латентном пространстве рекомендаций. Для тех, которые существуют, метрики сосредоточены на оценке уровней разделения для явно используемых и независимых атрибутов модели, вместо исследования возможных неявных ассоциаций предвзятости между векторами сущностей и чувствительными атрибутами или систематической предвзятости, зафиксированной в латентном пространстве [44]. Несмотря на то, что предвзятость латентного представления стала хорошо изученным явлением в других типах обучения представлений, таких как обработка естественного языка и изображений, она остается относительно малоизученной по сравнению с большим количеством исследований, касающихся предвзятости экспозиции и популярности [23].

\ Работа, представленная в этой статье, стремится закрыть текущий исследовательский пробел в оценке предвзятости представления в алгоритмах LFR, предоставляя структуру для оценки предвзятости ассоциации атрибутов. Выявление потенциальной предвзятости ассоциации атрибутов, закодированной во вложениях пользователей и элементов (сущностей), имеет важное значение, когда они становятся нисходящими функциями в гибридных многоступенчатых системах рекомендаций, часто встречающихся в промышленных условиях [6, 14]. Оценка композиционной справедливости этих систем или потенциала для предвзятости от одного компонента к усилению в нисходящих компонентах является сложной задачей, если не понимать, как этот тип предвзятости изначально возникает в компоненте системы [59]. Понимание текущего состояния предвзятости является необходимым при аудите и исследовании системы перед смягчением на практике [9]. Наши предлагаемые методы стремятся снизить барьер для практиков и исследователей, желающих понять, как предвзятость ассоциации атрибутов может проникнуть в их системы рекомендаций. Эти методы оценки позволят практикам более точно определить, какие атрибуты следует разделить при смягчении, и предоставить базовые линии для признания смягчения успешным.

\ Мы применяем эти методы к отраслевому практическому примеру для оценки предвзятости ассоциации гендерных атрибутов пользователей в модели LFR для рекомендаций подкастов. Предыдущие исследования в основном были сосредоточены на оценке гендерной предвзятости провайдеров из-за отсутствия общедоступных данных о гендерной предвзятости пользователей; насколько нам известно, наша работа предоставляет один из первых взглядов на количественную оценку гендерной предвзятости пользователей в рекомендациях подкастов. Мы надеемся, что наши наблюдения помогут другим отраслевым практикам оценить гендерную предвзятость пользователей и предвзятость ассоциации других чувствительных атрибутов в их системах, предоставят количественные сведения о прослушивании подкастов помимо более ранних качественных исследований пользователей и будут способствовать будущему обсуждению и большей прозрачности чувствительных тем в отраслевых системах.

\

:::info Авторы:

  1. Лекс Битти
  2. Изабель Корпус
  3. Люси Х. Лин
  4. Правин Равичандран

:::

:::info Эта статья доступна на arxiv по лицензии CC by 4.0 Deed (Attribution 4.0 International).

:::

\

Возможности рынка
Логотип Sleepless AI
Sleepless AI Курс (AI)
$0,04164
$0,04164$0,04164
-%0,83
USD
График цены Sleepless AI (AI) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу service@support.mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.