
«`html
Nomic AI представляет Nomic Embed Vision v1 и Nomic Embed Vision v1.5
Nomic AI недавно представила два значительных обновления в моделях мультимодальных вложений: Nomic Embed Vision v1 и Nomic Embed Vision v1.5. Эти модели разработаны для предоставления высококачественных, полностью воспроизводимых вложений видения, которые без проблем интегрируются с существующими моделями Nomic Embed Text v1 и v1.5. Эта интеграция создает унифицированное пространство вложений, которое повышает производительность мультимодальных и текстовых задач, превосходя конкурентов, таких как OpenAI CLIP и OpenAI Text Embedding 3 Small.
Применение и преимущества
Nomic Embed Vision призван решить ограничения существующих мультимодальных моделей, таких как CLIP, которые, хотя впечатляют нулевыми возможностями мультимодальности, показывают слабые результаты в задачах вне поиска изображений. Путем выравнивания визионного кодировщика с существующим пространством латентности Nomic Embed Text, Nomic создала унифицированное мультимодальное пространство латентности, которое превосходит в задачах изображений и текста. Это унифицированное пространство показало превосходную производительность на бенчмарках, таких как Imagenet 0-Shot, MTEB и Datacomp, что делает его первой моделью весов, достигшей таких результатов.
Практические применения
Модели Nomic Embed Vision могут встраивать изображения и текстовые данные, выполнять унимодальный семантический поиск внутри наборов данных и проводить мультимодальный семантический поиск по наборам данных. С 92 миллионами параметров визионный кодировщик идеален для использования в условиях высокого объема производства, дополняя 137 миллионов Nomic Embed Text. Nomic опубликовала код обучения и инструкции по воспроизведению, позволяя исследователям воспроизводить и улучшать модели.
Преимущества и результаты
Производительность этих моделей сравнивается с установленными стандартами, и Nomic Embed Vision продемонстрировал превосходную производительность в различных задачах. Например, Nomic Embed v1 достиг 70,70 на Imagenet 0-shot, 56,7 на Datacomp Avg. и 62,39 на MTEB Avg. Nomic Embed v1.5 показал немного лучшие результаты, указывая на надежность этих моделей.
Источник изображения
Nomic Embed Vision управляет мультимодальным поиском в Atlas, демонстрируя его способность понимать текстовые запросы и содержание изображений. Пример запроса продемонстрировал семантическое понимание модели, извлекая изображения милых животных из набора данных из 100 000 изображений и подписей.
Заключение
В заключение, Nomic Embed Vision v1 и v1.5 трансформируют мультимодальные вложения, обеспечивая унифицированное латентное пространство, превосходящее в задачах изображений и текста. С открытым исходным кодом обучения и обязательством к постоянному инновационному развитию, Nomic AI устанавливает новый стандарт в моделях вложений, предлагая мощные инструменты для различных приложений.
Источник
Оригинал статьи доступен по ссылке здесь.
Используйте ИИ для вашего бизнеса
Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ) и оставалась в числе лидеров, грамотно используйте Nomic AI Releases Nomic Embed Vision v1 and Nomic Embed Vision v1.5. Проанализируйте, как ИИ может изменить вашу работу, определите, где возможно применение автоматизации и ключевые показатели эффективности (KPI), которые вы хотите улучшить с помощью ИИ. Подберите подходящее решение и внедряйте ИИ решения постепенно, начиная с малого проекта и расширяя автоматизацию на основе полученных данных и опыта.
Обратитесь к нам для советов
Если вам нужны советы по внедрению ИИ, пишите нам на Telegram. Следите за новостями о ИИ в нашем Телеграм-канале или в Twitter.
AI Sales Bot
Попробуйте AI Sales Bot. Этот AI ассистент в продажах помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж и снижать нагрузку на первую линию.
Узнайте больше о ИИ
Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab itinai.ru. Будущее уже здесь!
«`