Аннотация
1 Введение
2 Связанные работы
2.1 Справедливость и предвзятость в рекомендациях
2.2 Количественная оценка гендерных ассоциаций в представлениях обработки естественного языка
3 Постановка проблемы
4 Методология
4.1 Область применения
4.3 Флаг
5 Практический пример
5.1 Область применения
5.2 Реализация
5.3 Флаг
6 Результаты
6.1 Визуализации латентного пространства
6.2 Направления предвзятости
6.3 Метрики усиления предвзятости
6.4 Сценарии классификации
7 Обсуждение
8 Ограничения и будущая работа
9 Заключение и ссылки
\
Исследования разделенных латентных факторных рекомендаций становятся все более популярными, поскольку было показано, что алгоритмы LFR запутывают атрибуты модели в результирующих обученных пользовательских и элементных вложениях, что приводит к нестабильным и неточным результатам рекомендаций [44, 58, 62, 65]. Однако большинство этих исследований ориентированы на результат, предоставляя методы смягчения для улучшения производительности, но не решая проблему потенциальной предвзятости представления в латентном пространстве. В результате лишь немногие существующие методы оценки анализируют, как атрибуты явно (из-за отдельного использования в качестве атрибута модели) или неявно фиксируются в латентном пространстве рекомендаций. Для тех, которые существуют, метрики сосредоточены на оценке уровней разделения для явно используемых и независимых атрибутов модели, вместо исследования возможных неявных ассоциаций предвзятости между векторами сущностей и чувствительными атрибутами или систематической предвзятости, зафиксированной в латентном пространстве [44]. Несмотря на то, что предвзятость латентного представления стала хорошо изученным явлением в других типах обучения представлений, таких как обработка естественного языка и изображений, она остается относительно малоизученной по сравнению с большим количеством исследований, касающихся предвзятости экспозиции и популярности [23].
\ Работа, представленная в этой статье, стремится закрыть текущий исследовательский пробел в оценке предвзятости представления в алгоритмах LFR, предоставляя структуру для оценки предвзятости ассоциации атрибутов. Выявление потенциальной предвзятости ассоциации атрибутов, закодированной во вложениях пользователей и элементов (сущностей), имеет важное значение, когда они становятся нисходящими функциями в гибридных многоступенчатых системах рекомендаций, часто встречающихся в промышленных условиях [6, 14]. Оценка композиционной справедливости этих систем или потенциала для предвзятости от одного компонента к усилению в нисходящих компонентах является сложной задачей, если не понимать, как этот тип предвзятости изначально возникает в компоненте системы [59]. Понимание текущего состояния предвзятости является необходимым при аудите и исследовании системы перед смягчением на практике [9]. Наши предлагаемые методы стремятся снизить барьер для практиков и исследователей, желающих понять, как предвзятость ассоциации атрибутов может проникнуть в их системы рекомендаций. Эти методы оценки позволят практикам более точно определить, какие атрибуты следует разделить при смягчении, и предоставить базовые линии для признания смягчения успешным.
\ Мы применяем эти методы к отраслевому практическому примеру для оценки предвзятости ассоциации гендерных атрибутов пользователей в модели LFR для рекомендаций подкастов. Предыдущие исследования в основном были сосредоточены на оценке гендерной предвзятости провайдеров из-за отсутствия общедоступных данных о гендерной предвзятости пользователей; насколько нам известно, наша работа предоставляет один из первых взглядов на количественную оценку гендерной предвзятости пользователей в рекомендациях подкастов. Мы надеемся, что наши наблюдения помогут другим отраслевым практикам оценить гендерную предвзятость пользователей и предвзятость ассоциации других чувствительных атрибутов в их системах, предоставят количественные сведения о прослушивании подкастов помимо более ранних качественных исследований пользователей и будут способствовать будущему обсуждению и большей прозрачности чувствительных тем в отраслевых системах.
\
:::info Авторы:
:::
:::info Эта статья доступна на arxiv по лицензии CC by 4.0 Deed (Attribution 4.0 International).
:::
\


