В этой статье представлено исследование методом абляции, подтверждающее, что адаптивная скорость обучения для каждого шага и каждого слоя является необходимой для фреймворка RECKONING.В этой статье представлено исследование методом абляции, подтверждающее, что адаптивная скорость обучения для каждого шага и каждого слоя является необходимой для фреймворка RECKONING.

Исследование абляции подтверждает необходимость динамических ставок для производительности RECKONING

2025/10/29 23:38
2м. чтение

Резюме и 1. Введение

  1. Фон

  2. Метод

  3. Эксперименты

    4.1 Производительность многоэтапного рассуждения

    4.2 Рассуждение с отвлекающими факторами

    4.3 Обобщение на знания реального мира

    4.4 Анализ времени выполнения

    4.5 Запоминание знаний

  4. Связанные работы

  5. Заключение, благодарности и ссылки

\ A. Набор данных

B. Контекстное рассуждение с отвлекающими факторами

C. Детали реализации

D. Адаптивная скорость обучения

E. Эксперименты с большими языковыми моделями

D Адаптивная скорость обучения

Предыдущие работы [3, 4] показывают, что фиксированная скорость обучения, общая для всех шагов и параметров, не улучшает производительность обобщения системы. Вместо этого [3] рекомендует изучать скорость обучения для

\ Таблица 8: Пример 6-этапного рассуждения из набора данных CLUTRR-SG.

\ Таблица 9: Пример отвлекающих факторов (черным) и релевантных знаний (красным) в наборе данных ProofWriter.

\ каждого слоя сети и каждого шага адаптации во внутреннем цикле. Параметры слоя могут научиться динамически регулировать скорость обучения на каждом шаге. Чтобы адаптивно контролировать скорость обучения α во внутреннем цикле, мы определяем α как набор регулируемых переменных: α = {α0, α1, …αL}, где L - количество слоев, и для каждого l = 0, …, L, αl является вектором с N элементами при заданном предопределенном количестве шагов внутреннего цикла N. Уравнение обновления внутреннего цикла тогда становится

\

\

\ Необходимы ли динамические скорости обучения для производительности RECKONING? Следуя предыдущим работам по мета-обучению [3, 4], мы динамически изучаем набор скоростей обучения для каждого шага и слоя для RECKONING. В этом исследовании мы анализируем, эффективно ли динамические скорости обучения для внутреннего цикла улучшают производительность рассуждений внешнего цикла. Аналогично, мы фиксируем другие экспериментальные настройки и устанавливаем количество шагов внутреннего цикла равным 4. Как показано на рисунке 8, при использовании статической скорости обучения (т.е. все слои и шаги внутреннего цикла используют постоянную скорость обучения), производительность значительно снижается (среднее снижение на 34,2%). Падение производительности становится более значительным для вопросов, требующих большего количества шагов рассуждения (снижение на 45,5% для 4-этапных и 39,5% для 6-этапных), что демонстрирует важность использования динамической скорости обучения во внутреннем цикле нашей структуры.

\ Рисунок 8: Мы изучаем, насколько динамическая скорость обучения во внутреннем цикле влияет на производительность внешнего цикла. Мы фиксируем все гиперпараметры, кроме опции использования динамической или фиксированной скорости обучения. Мы проводим анализ с использованием набора данных CLUTRR-SG, поскольку он более сложный и трудный (более низкая случайная производительность).

\

:::info Авторы:

(1) Zeming Chen, EPFL (zeming.chen@epfl.ch);

(2) Gail Weiss, EPFL (antoine.bosselut@epfl.ch);

(3) Eric Mitchell, Stanford University (eric.mitchell@cs.stanford.edu)';

(4) Asli Celikyilmaz, Meta AI Research (aslic@meta.com);

(5) Antoine Bosselut, EPFL (antoine.bosselut@epfl.ch).

:::


:::info Эта статья доступна на arxiv по лицензии CC BY 4.0 DEED.

:::

\

Возможности рынка
Логотип Solayer
Solayer Курс (LAYER)
$0.09056
$0.09056$0.09056
-6.45%
USD
График цены Solayer (LAYER) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу crypto.news@mexc.com для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

Платформы для предприятий на основе ИИ: насколько гибко переосмысление архитектуры SaaS для управляемого интеллекта

Платформы для предприятий на основе ИИ: насколько гибко переосмысление архитектуры SaaS для управляемого интеллекта

Платформы для предприятий на основе ИИ: наконец-то выходим за рамки AI-помощников? Вы когда-нибудь видели, как многообещающий ИИ-чатбот срывает ответ на важный запрос предложений? Отдел продаж спешит
Поделиться
Cxquest2026/03/02 15:13
[Перевод] Секретный ультиматум на $200 млн: почему Минобороны США угрожает уничтожить главную ИИ-компанию мира

[Перевод] Секретный ультиматум на $200 млн: почему Минобороны США угрожает уничтожить главную ИИ-компанию мира

На этой неделе произошла история, которую почти не заметили крупные СМИ, но она обнажила тектонический сдвиг в американской политике. Во вторник утром министр о
Поделиться
ProBlockChain2026/03/02 11:46
Как бездумное использование AI убивает экспертизу и превращает разработку в vibe coding

Как бездумное использование AI убивает экспертизу и превращает разработку в vibe coding

ВступлениеСейчас про AI говорят из каждого чайника.Скептики говорят, что AI — это всё хрень и очередной хайп. Нормисы говорят, что AI в целом норм. Компании гов
Поделиться
ProBlockChain2026/03/02 11:21