Mistral AI и NVIDIA представляют Mistral NeMo: 12B открытую языковую модель с 128k контекстом, мультиязычными возможностями и токенизатором Tekken.

«`html

Сотрудничество Mistral AI и NVIDIA: Релиз Mistral NeMo

В сотрудничестве с NVIDIA команда Mistral AI представила Mistral NeMo — революционную модель с 12 миллиардами параметров, обещающую установить новые стандарты в области искусственного интеллекта. Mistral NeMo выпущен под лицензией Apache 2.0 и разработан для высокопроизводительной работы на нескольких языках, способной обрабатывать контекстное окно до 128 000 токенов. Это значительное улучшение позволяет модели более эффективно обрабатывать и понимать большие объемы данных по сравнению с предшественниками. Команда выпустила два варианта:

Mistral-Nemo-Instruct-2407

Mistral-Nemo-Base-2407

Mistral NeMo выделяется своими уникальными способностями к рассуждению, обширными знаниями о мире и высокой точностью кодирования, что делает его лучшим в своей категории. Его архитектура основана на стандартных дизайнах, что обеспечивает легкую интеграцию в любую систему, использующую Mistral 7B. Эта безупречная совместимость предполагает широкое распространение среди исследователей и предприятий, стремящихся использовать передовые технологии искусственного интеллекта.

Команда Mistral AI выпустила как предварительно обученные базовые, так и инструкционно настроенные контрольные точки. Эти ресурсы предназначены для поддержки научного сообщества и профессионалов отрасли в их усилиях по исследованию и внедрению передовых решений в области искусственного интеллекта. Mistral NeMo разработан с учетом квантования, что позволяет проводить вывод FP8 без ухудшения производительности. Эта функция обеспечивает эффективную работу модели даже с представлениями данных низкой точности.

Источник изображения

Ключевым компонентом успеха Mistral NeMo является его мультиязычная способность, что делает его универсальным инструментом для глобальных приложений. Модель обучена вызову функций и особенно хорошо справляется с несколькими основными языками, включая английский, французский, немецкий, испанский, итальянский, португальский, китайский, японский, корейский, арабский и хинди. Эта широкая лингвистическая компетентность направлена на демократизацию доступа к передовым технологиям искусственного интеллекта, позволяя пользователям с различными языковыми фонами воспользоваться ее возможностями.

Источник изображения

Внедрение Tekken, нового токенизатора, дополнительно улучшает производительность Mistral NeMo. Основанный на Tiktoken, Tekken обучен в более чем 100 языках и значительно эффективнее сжимает естественный язык и исходный код, чем его предшественники. Например, он приблизительно на 30% эффективнее сжимает исходный код и несколько основных языков, и превосходит токенизатор Llama 3 в сжатии текста для около 85% всех языков. Эта увеличенная эффективность критически важна для обработки обширных данных, необходимых для современных приложений искусственного интеллекта.

Источник изображения

Продвинутый процесс инструкционной настройки Mistral NeMo отличает его от ранее выпущенных моделей, таких как Mistral 7B. Процессы настройки и выравнивания значительно улучшили способность модели следовать точным инструкциям, эффективно рассуждать, обрабатывать многоходовые разговоры и генерировать точный код. Эти улучшения критически важны для приложений, требующих высокой взаимодействия и точности, таких как боты обслуживания клиентов, помощники по кодированию и интерактивные образовательные инструменты.

Производительность Mistral NeMo была тщательно оценена и сравнена с другими ведущими моделями. Она постоянно демонстрирует превосходную точность и эффективность, подтверждая свою позицию как передовая модель искусственного интеллекта. Веса базовых и инструкционно настроенных моделей размещены на HuggingFace, что делает их легкодоступными для разработчиков и исследователей. Кроме того, Mistral NeMo можно получить через Mistral Inference и адаптировать с помощью Mistral Finetune, обеспечивая гибкие варианты для различных случаев использования.

Mistral NeMo также интегрирован в микросервис NIM для вывода от NVIDIA, доступный через ai.nvidia.com. Эта интеграция подчеркивает совместные усилия Mistral AI и NVIDIA по расширению границ технологий искусственного интеллекта и предоставлению надежных масштабируемых решений на рынке.

В заключение, выпуск Mistral NeMo с его передовыми возможностями, включая обширную мультиязычную поддержку, эффективное сжатие данных и высокую способность следовать инструкциям, позиционирует его как мощный инструмент для исследователей и предприятий. Сотрудничество между Mistral AI и NVIDIA является примером потенциала совместных усилий в продвижении технологических достижений и сделать передовой искусственный интеллект доступным для более широкой аудитории.

Веса размещены на HuggingFace как для базовых, так и для инструкционно настроенных моделей. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter.

Присоединяйтесь к нашему каналу в Telegram и группе в LinkedIn.

Если вам нравится наша работа, вам понравится наша рассылка.

Не забудьте присоединиться к нашему 46k+ ML SubReddit.

Источник: MarkTechPost

«`

saile.ru • ИИ в продажах

Mistral AI и NVIDIA представляют Mistral NeMo: 12B открытую языковую модель с 128k контекстом, мультиязычными возможностями и токенизатором Tekken.

Сотрудничество Mistral AI и NVIDIA: Релиз Mistral NeMo

Mistral-Nemo-Instruct-2407

Mistral-Nemo-Base-2407

Источник изображения

Источник изображения

Источник изображения

Бесплатный ИИ: для автоматизации продаж

Как рассказать про товар за 30 секунд без занудства: ИИ создаст текст по схеме “боль — выгода — результат”

Как закрыть сделку на Zoom: ИИ предложит 5 реплик, которые работают на финале воронки

Как перераспределить нагрузку между менеджерами: ИИ проанализирует воронку и укажет узкие места

Как определить маржинальность по менеджерам и сегментам: ИИ выделит прибыльных клиентов и зоны просадки

Как оценить эффективность менеджера по продажам: ИИ предложит KPI и матрицу оценки по ролям

Как управлять внутренней коммуникацией по клиенту: ИИ сгенерирует план согласования задач внутри компании

Как подготовить технические ответы на RFP: ИИ предложит шаблон по типовым запросам и блокам

Как провести ABC-анализ клиентов и распределить усилия: ИИ подскажет фокусные сегменты

Как создать FAQ по продукту для ускорения продаж: ИИ сгенерирует 15 технических вопросов и ответов

Как собрать инсайты продаж из звонков и переписок: ИИ выделит триггеры и возражения

Как повысить вовлечённость на онлайн-тренингах: ИИ предложит сценарий с вопросами, квизами и упражнениями

Как подготовить технический блок в коммерческом предложении: ИИ составит текст на 1 страницу

Умные продажи

Могут ли более компактные модели искусственного интеллекта превзойти гигантов?

Инструмент для модерации WildGuard: легкий и многофункциональный для оценки безопасности взаимодействия пользователей.

Новый оптимизатор MIPRO превосходит базовые модели на пяти из шести разнообразных языковых моделях LM на 12,9% точности.

Исследователи Weaviate представили вызов функций для LLM: устранение зависимости от SQL для повышения точности и эффективности запросов к базе данных

Улучшение запоминания и внимания с помощью SirLLM: новые возможности.

Система ответов на вопросы на основе больших языковых моделей.

Microsoft выпустила PromptWizard: инструмент для улучшения запросов к ИИ.

MinMo: Мультимодальная языковая модель с примерно 8 миллиардами параметров для удобного голосового взаимодействия

Доступность

Пресс-релизы

Страница главного редактора

Карта сайта

Контакты

О нас