Машинное обучение с использованием графов и байесовских сетей для выбора примеров в контексте

GraphIC: Новый подход машинного обучения, использующий графовые представления процессов рассуждения в сочетании с байесовскими сетями для выбора примеров в контексте (ICE)

Практические решения для улучшения задач многошагового рассуждения

В контекстном обучении (ICL) LLM могут адаптироваться к новым задачам, включая несколько примеров непосредственно во входных данных без обновления параметров. Однако выбор подходящих примеров в контексте (ICE) критичен, особенно для функций, таких как математика и логика, требующих многошагового рассуждения. Традиционные текстовые вложения часто уделяют приоритет поверхностным семантическим сходствам, которые могут не соответствовать более глубоким структурам рассуждения, необходимым для таких задач. Недавние исследования предлагают, что графовые представления отражают когнитивные процессы человека и могут лучше моделировать многошаговое рассуждение и улучшить выбор ICE, захватывая передаваемые мыслительные шаблоны.

Существующие техники выбора ICE делятся на две категории: без обучения и на основе обучения. Методы без обучения обычно используют эвристические критерии, такие как сходство, разнообразие или сложность, или полагаются на обратную связь от LLM, такую как вероятностные распределения или выходные данные модели, для направления выбора. Хотя эти подходы эффективны с вычислительной точки зрения, они часто должны показывать лучшие результаты по сравнению с методами на основе обучения. Методы на основе обучения фокусируются на выборе отдельных или групповых примеров, но требуют больших ресурсов.

Команда исследователей из Университета Юго-Восточного, Пекинского института математических наук, Йельского университета и Университета Калифорнии в Сан-Диего представила GraphIC, метод выбора ICE на основе графов. GraphIC использует графовые представления и байесовские сети (BN) для захвата процессов рассуждения и выбора ICE, фильтруя нерелевантные семантические аспекты, сохраняя при этом основные рассуждения. Он отражает когнитивные процессы человека, моделируя зависимости мыслей. Система выбора примеров GraphIC выстраивает примеры в соответствии с структурой рассуждения запроса, даже если они не семантически схожи. Эксперименты на задачах математического рассуждения и генерации кода показывают, что GraphIC превосходит как методы без обучения, так и методы на основе обучения по эффективности и эффективности.

Предложенная модель GraphIC использует графовые представления для улучшения выбора примеров для задач рассуждения. Она вводит «мыслительные графы», представляющие шаги рассуждения как узлы, и использует вероятностную модель на основе BN для захвата зависимостей между мыслями. Система выбора примеров выбирает примеры, максимизирующие плотность вероятности процессов рассуждения. Механизм персонализированного PageRank уточняет мыслительный граф, имитируя то, как люди возвращаются к более ранним шагам при решении проблем. Через оптимизацию билинейной формы GraphIC эффективно выбирает примеры с наивысшим потенциалом для решения многошаговых задач рассуждения, превосходя традиционные методы на основе сходства графов.

Модель GraphIC оценивается на четырех бенчмарках рассуждения: GSM8K и AQUA (математическое рассуждение), MBPP (генерация кода) и ProofWriter (логическое рассуждение). Используя GPT-4o-mini и Llama-3.1-8B-Instruct, GraphIC превосходит базовые модели выбора без обучения и на основе обучения, с средним приростом соответственно 2,57% и 4,29%. Он отлично справляется с сложными задачами рассуждения, особенно в математических и логических наборах данных, таких как GSM8K и AQUA. Анализы абляции подчеркивают важность мыслительных графов, персонализированного PageRank (PPR) и выбора на основе BN для улучшения производительности. GraphIC последовательно демонстрирует устойчивое улучшение производительности на всех наборах данных по мере увеличения количества примеров ICE.

В заключение, GraphIC — это графовый метод выбора ICE, разработанный для улучшения LLM в задачах многошагового рассуждения. Представляя рассуждение как «мыслительные графы» и используя BN и персонализированный PageRank, GraphIC выбирает ICE, соответствующие структурам когнитивного рассуждения. Он превосходит методы текстовых вложений, которые нуждаются в помощи в сложных задачах рассуждения. Экспериментальные результаты по математическим, логическим и функциям генерации кода показывают, что GraphIC последовательно превосходит как методы без обучения, так и методы на основе обучения. Хотя его без обучения имеет ограничения в захвате сложных мыслительных шаблонов, он предлагает способ представления и улучшения процессов рассуждения LLM.

saile.ru • ИИ в продажах

Машинное обучение с использованием графов и байесовских сетей для выбора примеров в контексте

Практические решения для улучшения задач многошагового рассуждения

Бесплатный ИИ: для автоматизации продаж

Как провести конкурентный анализ: ИИ сгенерирует таблицу сравнения и выводы

Как проводить еженедельные touchpoints с клиентом: ИИ предложит структуру коротких регулярных созвонов

Как мотивировать команду без увеличения фонда оплаты: ИИ предложит нематериальные модели мотивации

Как выявить пробелы в навыках команды: ИИ сгенерирует диагностическую сессию на 30 минут

Как рассказать про товар за 30 секунд без занудства: ИИ создаст текст по схеме “боль — выгода — результат”

Как убедить клиента в безопасности и стабильности решения: ИИ подберёт аргументы и ссылки на стандарты

Как создать FAQ по продукту для ускорения продаж: ИИ сгенерирует 15 технических вопросов и ответов

Как определить маржинальность по менеджерам и сегментам: ИИ выделит прибыльных клиентов и зоны просадки

Как зафиксировать цели и ожидания клиента: ИИ сгенерирует матрицу ожиданий и метрик для контроля

Как подготовить карту стейкхолдеров клиента: ИИ создаст схему влияния и план работы с ЛПР

Как построить email-цепочку для новых лидов: ИИ предложит 5 писем с темами и CTA

Как быстро отработать 7 типовых возражений клиента: ИИ предложит готовые формулировки под скрипт

Умные продажи

Ученые из NASA и IBM представляют INDUS: набор крупных языковых моделей для научных исследований

Новый метод ИИ для автоматического создания графа атак.

Выбор данных для задач: практический подход к улучшению эффективности и производительности дообучения

Майкрософт представляет Aurora: модель атмосферы, обученная на миллионе часов погодных данных

GTM 144: Как ИИ Переписывает Стратегии Разработки Продукта

UGround: Универсальная модель визуального привязывания интерфейса, разработанная на основе больших объемов синтетических данных из интернета.

AI-агент Agent-E достигает 73.2% успешных действий в автономной навигации в Интернете.

О нас

Авторские права

Политика конфиденциальности

Условия использования

Подписка

Отказ от ответственности