Купить крипто Рынки Спот ФьючерсыINTC Сбережения Центр событий

Еще

Исследование подтверждает, что способность RECKONING распутывать соответствующие знания сохраняется даже при масштабировании размера модели с использованием GPT-2-XL-LoRAИсследование подтверждает, что способность RECKONING распутывать соответствующие знания сохраняется даже при масштабировании размера модели с использованием GPT-2-XL-LoRA

Устойчивость к отвлекающим факторам: RECKONING значительно превосходит FT-ICR в рассуждениях о нерелевантных фактах

Источник: Hackernoon

2025/10/25 01:09

3м. чтение

Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу crypto.news@mexc.com

Таблица ссылок

Резюме и 1. Введение

Фон
Метод
Эксперименты

4.1 Производительность многоходового рассуждения

4.2 Рассуждение с дистракторами

4.3 Обобщение на знания реального мира

4.4 Анализ времени выполнения

4.5 Запоминание знаний
Связанные работы
Заключение, благодарности и ссылки

\ A. Набор данных

B. Контекстное рассуждение с дистракторами

C. Детали реализации

D. Адаптивная скорость обучения

E. Эксперименты с большими языковыми моделями

4.2 Рассуждение с дистракторами

В случаях, когда на один и тот же набор знаний необходимо ответить на несколько вопросов, некоторые знания, релевантные для одного вопроса, вероятно, будут нерелевантными для другого. Например, в Таблице 7 факт "Чарли белый" не нужен для ответа на вопрос "Гарри красный?". Таким образом, важно оценить устойчивость RECKONING при наличии нерелевантной информации (т.е. дистракторов) в наборе знаний. В этом эксперименте мы анализируем способность RECKONING фокусироваться на правильных знаниях и игнорировать дистракторы при ответе на вопросы. Мы используем ProofWriter в качестве набора данных для оценки, поскольку он уже имеет настройку с дистракторами, включенными в знания. Для систематического анализа мы постепенно добавляем дистракторы в контекст (начиная с 2 и заканчивая всеми возможными дистракторами, которых в среднем 7 на вопрос). Мы обучаем RECKONING и базовую модель, используя многозадачную цель, где модель должна (1) вспомнить все факты и правила, релевантные для вопроса, и (2) предсказать вывод на основе правильных знаний. В этом случае мы адаптируем обучение таким образом, что для каждого вопроса x потеря CLM внешнего цикла (Уравнение (5)) вычисляется только относительно релевантных фактов из K, тем самым обучаясь вспоминать только релевантные факты во время обучения.

\ На Рисунке 5 мы видим, что производительность RECKONING стабильно более устойчива к дистракторам, чем базовая модель FT-ICR. Когда мы включаем все дистракторы в контекст, RECKONING достигает значительно более высокой средней точности меток (82,5%) по всем переходам, чем базовая модель (70,9%), как вычислено по среднему значению 3 рассматриваемых глубин переходов. Кроме того, по сравнению с производительностью без дистракторов, производительность RECKONING падает только на 17,1%, в то время как производительность базовой модели падает на 28,6%, тем самым демонстрируя лучшую способность отделять правильные знания от дистракторов.

\ Наконец, мы также исследуем обобщаемость RECKONING на модели с большим размером параметров. Мы масштабируем используемую нами языковую модель, GPT-2-small (124M), до GPT-2-XL (1,5B), применяя метод эффективной тонкой настройки параметров LoRA [33]. Для простоты мы оцениваем модели только на самых сложных настройках, т.е. ProofWriter-5-hop со всеми дистракторами. С GPT-2-XL-LoRA контекстное рассуждение достигает 65% точности на тестовом наборе, в то время как наша модель RECKONING достигает 70,2% точности, что на 5% больше. Этот результат предполагает, что преимущества RECKONING в присутствии дистракторов сохраняются даже при увеличении размера моделей.

:::info Авторы:

(1) Zeming Chen, EPFL (zeming.chen@epfl.ch);

(2) Gail Weiss, EPFL (antoine.bosselut@epfl.ch);

(3) Eric Mitchell, Stanford University (eric.mitchell@cs.stanford.edu)';

(4) Asli Celikyilmaz, Meta AI Research (aslic@meta.com);

(5) Antoine Bosselut, EPFL (antoine.bosselut@epfl.ch).

:::

:::info Эта статья доступна на arxiv по лицензии CC BY 4.0 DEED.

:::

CHZ +28%! История повторяется?

Лонг и шорт позиции с 0 комиссией. Будьте готовы!

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Новости 24/7 в прямом эфире

Еще

MoneyGram становится валидатором Solana и присоединяется к платформе для разработчиков.

Автор: DEGEN NEWS20:41

Объем торгов токенизированными акциями на базе Solana достиг $200 млн благодаря xStocksFi и токенам Backpack.

Автор: DEGEN NEWS19:47

Полупроводники привлекают значительное внимание, увеличивая позиции на 10 миллионов иен за один день.

Автор: DEG18:14

SK Hynix обошла Samsung, став самой дорогой компанией Южной Кореи.

Автор: Cooker.hl | 版本之子 (Theo Arc)15:32

SK Hynix обошла Samsung, став самой дорогой компанией Южной Кореи.

Автор: Nehal14:26

Быстрое чтение

Еще

Цены на криптовалюту

Биткоин

BTC

$65,175.49

$65,175.49$65,175.49

+1.47%

Эфириум

ETH

$1,765.98

$1,765.98$1,765.98

+2.03%

Солана

SOL

$74.44

$74.44$74.44

+0.40%

USDCoin

USDC

$1.00078

$1.00078$1.00078

-0.01%

Рипл

XRP

$1.1537

$1.1537$1.1537

+0.35%

Комбо Кубка мира: Цель на 200x

До 20 комбо в матчах Кубка мира за 1 ордер

Устойчивость к отвлекающим факторам: RECKONING значительно превосходит FT-ICR в рассуждениях о нерелевантных фактах

Таблица ссылок

4.2 Рассуждение с дистракторами

Вам также может быть интересно

Полный чеклист перед первой покупкой цифрового актива

Признание PhotonPay на саммите сигнализирует о том, что стейблкоин-платежи больше не являются нишевым экспериментом

Доллар растёт, иена достигла 40-летнего минимума — вот что за этим стоит

Популярные новости

Новости Solana: Toss Bank протестирует переводы на Solana и расчёты в стейблкоине в Южной Корее

22.06.2026, 13-53 изменены значения нижней границы ценового коридора РЕПО, ставки переноса и диапазона оценки процентных рисков ценной бумаги LEAS (Европлан).

22.06.2026, 13-23 изменены значения нижней границы ценового коридора РЕПО, ставки переноса и диапазона оценки процентных рисков ценной бумаги CNRU (iЦиан).

22.06.2026, 13-14 изменены значения нижней границы ценового коридора РЕПО, ставки переноса и диапазона оценки процентных рисков ценной бумаги LEAS (Европлан).

LRT3 официально запускается 29 июня

Новости 24/7 в прямом эфире

Быстрое чтение

Переговоры между США и Ираном возобновились: нефть упала ниже 80 долларов, что дальше с акциями?

Бомба Apple-Intel Трампа: что на самом деле означает сделка с чипами для акций полупроводников

Переговоры рушатся! Встреча США-Иран-Швейцария отменена - Bitcoin Drops 2%

Крайний срок MiCA 1 июля: 83% криптофирм ЕС сталкиваются с закрытием - кто победит в Fallout?

Прогноз цены XRP Q2 2026: дно наступило или распродажа еще не закончилась?

Цены на криптовалюту