
GraphIC: Новый подход машинного обучения, использующий графовые представления процессов рассуждения в сочетании с байесовскими сетями для выбора примеров в контексте (ICE)
Практические решения для улучшения задач многошагового рассуждения
В контекстном обучении (ICL) LLM могут адаптироваться к новым задачам, включая несколько примеров непосредственно во входных данных без обновления параметров. Однако выбор подходящих примеров в контексте (ICE) критичен, особенно для функций, таких как математика и логика, требующих многошагового рассуждения. Традиционные текстовые вложения часто уделяют приоритет поверхностным семантическим сходствам, которые могут не соответствовать более глубоким структурам рассуждения, необходимым для таких задач. Недавние исследования предлагают, что графовые представления отражают когнитивные процессы человека и могут лучше моделировать многошаговое рассуждение и улучшить выбор ICE, захватывая передаваемые мыслительные шаблоны.
Существующие техники выбора ICE делятся на две категории: без обучения и на основе обучения. Методы без обучения обычно используют эвристические критерии, такие как сходство, разнообразие или сложность, или полагаются на обратную связь от LLM, такую как вероятностные распределения или выходные данные модели, для направления выбора. Хотя эти подходы эффективны с вычислительной точки зрения, они часто должны показывать лучшие результаты по сравнению с методами на основе обучения. Методы на основе обучения фокусируются на выборе отдельных или групповых примеров, но требуют больших ресурсов.
Команда исследователей из Университета Юго-Восточного, Пекинского института математических наук, Йельского университета и Университета Калифорнии в Сан-Диего представила GraphIC, метод выбора ICE на основе графов. GraphIC использует графовые представления и байесовские сети (BN) для захвата процессов рассуждения и выбора ICE, фильтруя нерелевантные семантические аспекты, сохраняя при этом основные рассуждения. Он отражает когнитивные процессы человека, моделируя зависимости мыслей. Система выбора примеров GraphIC выстраивает примеры в соответствии с структурой рассуждения запроса, даже если они не семантически схожи. Эксперименты на задачах математического рассуждения и генерации кода показывают, что GraphIC превосходит как методы без обучения, так и методы на основе обучения по эффективности и эффективности.
Предложенная модель GraphIC использует графовые представления для улучшения выбора примеров для задач рассуждения. Она вводит «мыслительные графы», представляющие шаги рассуждения как узлы, и использует вероятностную модель на основе BN для захвата зависимостей между мыслями. Система выбора примеров выбирает примеры, максимизирующие плотность вероятности процессов рассуждения. Механизм персонализированного PageRank уточняет мыслительный граф, имитируя то, как люди возвращаются к более ранним шагам при решении проблем. Через оптимизацию билинейной формы GraphIC эффективно выбирает примеры с наивысшим потенциалом для решения многошаговых задач рассуждения, превосходя традиционные методы на основе сходства графов.
Модель GraphIC оценивается на четырех бенчмарках рассуждения: GSM8K и AQUA (математическое рассуждение), MBPP (генерация кода) и ProofWriter (логическое рассуждение). Используя GPT-4o-mini и Llama-3.1-8B-Instruct, GraphIC превосходит базовые модели выбора без обучения и на основе обучения, с средним приростом соответственно 2,57% и 4,29%. Он отлично справляется с сложными задачами рассуждения, особенно в математических и логических наборах данных, таких как GSM8K и AQUA. Анализы абляции подчеркивают важность мыслительных графов, персонализированного PageRank (PPR) и выбора на основе BN для улучшения производительности. GraphIC последовательно демонстрирует устойчивое улучшение производительности на всех наборах данных по мере увеличения количества примеров ICE.
В заключение, GraphIC — это графовый метод выбора ICE, разработанный для улучшения LLM в задачах многошагового рассуждения. Представляя рассуждение как «мыслительные графы» и используя BN и персонализированный PageRank, GraphIC выбирает ICE, соответствующие структурам когнитивного рассуждения. Он превосходит методы текстовых вложений, которые нуждаются в помощи в сложных задачах рассуждения. Экспериментальные результаты по математическим, логическим и функциям генерации кода показывают, что GraphIC последовательно превосходит как методы без обучения, так и методы на основе обучения. Хотя его без обучения имеет ограничения в захвате сложных мыслительных шаблонов, он предлагает способ представления и улучшения процессов рассуждения LLM.