
«`html
Сотрудничество Mistral AI и NVIDIA: Релиз Mistral NeMo
В сотрудничестве с NVIDIA команда Mistral AI представила Mistral NeMo — революционную модель с 12 миллиардами параметров, обещающую установить новые стандарты в области искусственного интеллекта. Mistral NeMo выпущен под лицензией Apache 2.0 и разработан для высокопроизводительной работы на нескольких языках, способной обрабатывать контекстное окно до 128 000 токенов. Это значительное улучшение позволяет модели более эффективно обрабатывать и понимать большие объемы данных по сравнению с предшественниками. Команда выпустила два варианта:
Mistral-Nemo-Instruct-2407
Mistral-Nemo-Base-2407
Mistral NeMo выделяется своими уникальными способностями к рассуждению, обширными знаниями о мире и высокой точностью кодирования, что делает его лучшим в своей категории. Его архитектура основана на стандартных дизайнах, что обеспечивает легкую интеграцию в любую систему, использующую Mistral 7B. Эта безупречная совместимость предполагает широкое распространение среди исследователей и предприятий, стремящихся использовать передовые технологии искусственного интеллекта.
Команда Mistral AI выпустила как предварительно обученные базовые, так и инструкционно настроенные контрольные точки. Эти ресурсы предназначены для поддержки научного сообщества и профессионалов отрасли в их усилиях по исследованию и внедрению передовых решений в области искусственного интеллекта. Mistral NeMo разработан с учетом квантования, что позволяет проводить вывод FP8 без ухудшения производительности. Эта функция обеспечивает эффективную работу модели даже с представлениями данных низкой точности.
Источник изображения
Ключевым компонентом успеха Mistral NeMo является его мультиязычная способность, что делает его универсальным инструментом для глобальных приложений. Модель обучена вызову функций и особенно хорошо справляется с несколькими основными языками, включая английский, французский, немецкий, испанский, итальянский, португальский, китайский, японский, корейский, арабский и хинди. Эта широкая лингвистическая компетентность направлена на демократизацию доступа к передовым технологиям искусственного интеллекта, позволяя пользователям с различными языковыми фонами воспользоваться ее возможностями.
Источник изображения
Внедрение Tekken, нового токенизатора, дополнительно улучшает производительность Mistral NeMo. Основанный на Tiktoken, Tekken обучен в более чем 100 языках и значительно эффективнее сжимает естественный язык и исходный код, чем его предшественники. Например, он приблизительно на 30% эффективнее сжимает исходный код и несколько основных языков, и превосходит токенизатор Llama 3 в сжатии текста для около 85% всех языков. Эта увеличенная эффективность критически важна для обработки обширных данных, необходимых для современных приложений искусственного интеллекта.
Источник изображения
Продвинутый процесс инструкционной настройки Mistral NeMo отличает его от ранее выпущенных моделей, таких как Mistral 7B. Процессы настройки и выравнивания значительно улучшили способность модели следовать точным инструкциям, эффективно рассуждать, обрабатывать многоходовые разговоры и генерировать точный код. Эти улучшения критически важны для приложений, требующих высокой взаимодействия и точности, таких как боты обслуживания клиентов, помощники по кодированию и интерактивные образовательные инструменты.
Производительность Mistral NeMo была тщательно оценена и сравнена с другими ведущими моделями. Она постоянно демонстрирует превосходную точность и эффективность, подтверждая свою позицию как передовая модель искусственного интеллекта. Веса базовых и инструкционно настроенных моделей размещены на HuggingFace, что делает их легкодоступными для разработчиков и исследователей. Кроме того, Mistral NeMo можно получить через Mistral Inference и адаптировать с помощью Mistral Finetune, обеспечивая гибкие варианты для различных случаев использования.
Mistral NeMo также интегрирован в микросервис NIM для вывода от NVIDIA, доступный через ai.nvidia.com. Эта интеграция подчеркивает совместные усилия Mistral AI и NVIDIA по расширению границ технологий искусственного интеллекта и предоставлению надежных масштабируемых решений на рынке.
В заключение, выпуск Mistral NeMo с его передовыми возможностями, включая обширную мультиязычную поддержку, эффективное сжатие данных и высокую способность следовать инструкциям, позиционирует его как мощный инструмент для исследователей и предприятий. Сотрудничество между Mistral AI и NVIDIA является примером потенциала совместных усилий в продвижении технологических достижений и сделать передовой искусственный интеллект доступным для более широкой аудитории.
Веса размещены на HuggingFace как для базовых, так и для инструкционно настроенных моделей. Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на наш Twitter.
Присоединяйтесь к нашему каналу в Telegram и группе в LinkedIn.
Если вам нравится наша работа, вам понравится наша рассылка.
Не забудьте присоединиться к нашему 46k+ ML SubReddit.
Источник: MarkTechPost
«`