
«`html
Способности Теории Разума (ToM) – это умение приписывать ментальные состояния и предсказывать поведение других. Эти способности становятся все более важными с интеграцией Больших Языковых Моделей (LLMs) в человеческие взаимодействия и процессы принятия решений.
Текущие методики оценки ToM в LLM имеют несколько ограничений:
Исследователи из Allen Institute for AI, Университета Вашингтона и Стэнфордского университета представляют SimpleToM – надежный набор данных для оценки возможностей ToM в LLM через краткие, но разнообразные истории. SimpleToM использует трехуровневую структуру вопросов, которая последовательно проверяет различные аспекты рассуждений ToM.
SimpleToM включает десять различных сценариев асимметрии информации, отражающих реальные ситуации. Каждая история состоит из двух предложений и избегает явных слов, связанных с восприятием, заставляя модели делать неявные выводы.
Набор данных проходит строгий контроль качества, включая ручную проверку квалифицированными аннотаторами. В результате получено 1,147 высококачественных историй, эффективно тестирующих возможности ToM.
Анализ SimpleToM показывает, что современные модели, такие как GPT-4, демонстрируют высокую точность в выводах о ментальных состояниях, но испытывают трудности с предсказанием поведения. Это подчеркивает важность дальнейшего развития AI-систем, способных работать в сложных, ориентированных на человека условиях.
Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ), следуйте этим рекомендациям:
Если вам нужны советы по внедрению ИИ, пишите нам. Следите за новостями об ИИ в нашем Телеграм-канале.
Попробуйте AI Sales Bot – это ИИ ассистент для продаж, который помогает отвечать на вопросы клиентов и генерировать контент для отдела продаж.
Узнайте, как ИИ может изменить процесс продаж в вашей компании с решением от saile.ru. Будущее уже здесь!
«`
Оставьте заявку — мы свяжемся с вами и расскажем, как начать работу