Itinai.com beautiful russian high fashion sales representativ 867c65a8 b79e 4878 bf8c fc0d0574b6a0 3
Itinai.com beautiful russian high fashion sales representativ 867c65a8 b79e 4878 bf8c fc0d0574b6a0 3

Salesforce AI Research представила новую систему оценки для RAG-систем на основе охвата под-вопросов.

 Salesforce AI Research Introduces a Novel Evaluation Framework for Retrieval-Augmented Generation (RAG) Systems based on Sub-Question Coverage

«`html

Системы генерации с поддержкой извлечения (RAG)

Системы RAG объединяют процессы извлечения и генерации для решения сложных открытых вопросов. Используя актуальные документы и знания, модели на основе RAG формируют ответы с дополнительным контекстом, что дает более глубокие инсайты по сравнению с моделями только генерации. Это особенно полезно в областях, где ответы должны учитывать широкий объем информации, например, в юридических исследованиях и академическом анализе.

Проблемы оценки эффективности систем RAG

Оценка эффективности систем RAG представляет собой уникальные трудности, так как они часто должны отвечать на нечеткие вопросы, требующие более одной четкой реакции. Традиционные метрики, такие как актуальность и достоверность, не всегда учитывают сложные многослойные подтемы. В реальных приложениях вопросы часто состоят из основных запросов, поддерживаемых дополнительным контекстом, что требует более целостного ответа.

Новая методика оценки систем RAG

Исследователи из Georgia Institute of Technology и Salesforce AI Research предложили новую методику оценки систем RAG на основе метрики «покрытие подтем». Вместо общих оценок актуальности, они предлагают разбивать вопросы на конкретные подтемы, которые классифицируются как основные, фоновые или дополнительные. Этот подход позволяет более точно оценивать качество ответов, анализируя, насколько хорошо каждая подтема охвачена.

Результаты исследования

Результаты показали значительные тренды среди систем, подчеркивая их сильные и слабые стороны. Все системы RAG не достигли полного покрытия основных подтем. Например, You.com обеспечил покрытие 42%, Perplexity AI — 54%, а Bing Chat — 49%. Однако покрытие фоновых подтем было значительно ниже, что указывает на недостаток контекстной поддержки ответов.

Ключевые выводы

  • Покрытие основных подтем: В среднем системы RAG упускали около 50% основных подтем, что является явной областью для улучшения.
  • Точность систем: Perplexity AI лидировал с 71% точности в связи извлеченного контента с ответами.
  • Важность фоновой информации: Покрытие фоновых подтем было низким, от 14% до 20%.
  • Ранжирование производительности: Perplexity AI занял первое место, Bing Chat показал хорошие результаты в структурировании ответов.
  • Потенциал для улучшения: Все системы RAG имеют значительный потенциал для повышения качества ответов.

Заключение

Это исследование переопределяет, как оцениваются системы RAG, подчеркивая важность покрытия подтем как основного показателя успеха. Результаты показывают необходимость в фокусированном увеличении извлечения информации и предлагают практические шаги для улучшения систем RAG, делая их более устойчивыми для сложных задач.

Как ИИ может помочь вашему бизнесу

Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ), грамотно используйте доступные решения. Проанализируйте, как ИИ может изменить вашу работу, и определите, где возможно применение автоматизации.

Подберите подходящее решение и внедряйте ИИ постепенно. Начните с небольшого проекта, анализируйте результаты и KPI, а затем расширяйте автоматизацию на основе полученных данных.

Если вам нужны советы по внедрению ИИ, пишите нам в Телеграм.

Попробуйте AI Sales Bot — это AI ассистент для продаж, который помогает отвечать на вопросы клиентов и генерировать контент для отдела продаж.

Узнайте, как ИИ может изменить процесс продаж в вашей компании!

«`

Бесплатный ИИ: для автоматизации продаж

Умные продажи