
«`html
Решение токсичности в LLM: значение и практические рекомендации
Рост низкокачественных данных в интернете приводит к наличию нежелательных, небезопасных или токсичных знаний в больших языковых моделях (LLM). При использовании этих моделей в чат-ботах возрастает риск предоставления пользователям вредных советов или агрессивного поведения. Существующие наборы данных для оценки токсичности, в основном ориентированные на английский язык, не улавливают мультиязычную токсичность, что подвергает опасности безопасность LLM. AI2 совместно с CMU решает проблему ограничения токсичности в LLM на нескольких языках. Исследование обсуждает, как токсичность изменяется в зависимости от языковых ресурсов и влияния дизайнерских решений, таких как размер модели и методы выравнивания.
Оценка токсичности в LLM: новый подход
Текущие методы оценки токсичности в LLM недостаточны для улавливания мультиязычной токсичности. Исследователи AI2 и CMU представили PolygloToxicityPrompts, набор данных, состоящий из 425 000 естественных запросов на 17 языках с различными уровнями токсичности. Этот набор данных направлен на более точное представление токсичности в LLM путем использования запросов, извлеченных из веб-ресурсов, и фокусировки на коротких, потенциально токсичных фрагментах текста. Набор данных строится на основе предыдущих работ, таких как RealToxicityPrompts, но расширяет свой охват до мультиязычного контекста.
Практическое применение PolygloToxicityPrompts
PolygloToxicityPrompts разработан для улавливания большего количества токсичности в LLM путем фокусировки на коротких запросах вместо полных комментариев или бесед. Это позволяет моделям идентифицировать токсичность на начальных этапах общения. Набор данных включает множество языков, устраняя пробелы, оставленные преимущественно англоязычными наборами данных. Используя PerspectiveAPI для измерения токсичности запросов, исследователи вычисляют среднюю токсичность модели для всех ее продолжений.
Значение размера модели и методов выравнивания
Исследование использует влияние размера модели и методов выравнивания на токсичность. Для базовых LLM токсичность увеличивается с увеличением размера модели, что свидетельствует о том, что большие модели имеют тенденцию учить больше токсичности из обучающих данных. Однако модели, настроенные на инструкции и предпочтения, менее токсичны, чем базовые модели. Исследование сравнивает PerspectiveAPI, детектор токсичности, с Llama Guard, детектором безопасности, и заключает, что, хотя связаны, токсичность и безопасность являются различными концепциями, требующими своих решений.
Заключение: путь к безопасной среде онлайн
PolygloToxicityPrompts предлагает ценный инструмент для оценки и смягчения токсичности в LLM на нескольких языках. Статья содержит умозрительные выводы, подчеркивающие важность языка запросов, размера модели и методов выравнивания в борьбе с токсичным деградацией. Набор данных помогает создавать более надежные модели для проактивной модерации и фильтрации мультиязычного контента, способствуя безопасной онлайн-среде.
Подробнее о статье и наборе данных вы можете узнать по ссылке. Вся заслуга за это исследование принадлежит его ученым. Также, не забудьте подписаться на наш Twitter.
Присоединяйтесь к нашему Telegram каналу и группе в LinkedIn.
Если вам понравилась наша работа, вам понравится и наша рассылка.
Не забудьте присоединиться к нашему Reddit сообществу.
Источник: MarkTechPost
Внедрение ИИ в сфере продаж и маркетинга
Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ) и оставалась в числе лидеров, грамотно используйте PolygloToxicityPrompts: A Dataset of 425K Naturally-Occurring Prompts Across 17 Languages with Varying Degrees of Toxicity.
Проанализируйте, как ИИ может изменить вашу работу. Определите, где возможно применение автоматизации: найдите моменты, когда ваши клиенты могут извлечь выгоду из AI. Определитесь, какие ключевые показатели эффективности (KPI) вы хотите улучшить с помощью ИИ.
Подберите подходящее решение, сейчас очень много вариантов ИИ. Внедряйте ИИ решения постепенно: начните с малого проекта, анализируйте результаты и KPI. На полученных данных и опыте расширяйте автоматизацию.
Если вам нужны советы по внедрению ИИ, пишите нам на Telegram. Следите за новостями о ИИ в нашем Телеграм-канале или в Twitter.
Попробуйте AI Sales Bot. Этот AI ассистент в продажах помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж, снижать нагрузку на первую линию.
Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab. Будущее уже здесь!
«`