
«`html
Проблемы существующих моделей анализа графиков и их решение
Графики являются важным инструментом в различных областях, но текущие модели анализа графиков имеют ограничения. Они часто полагаются на таблицы данных вместо визуальных шаблонов и используют слабо согласованные модели видения-языка, что ограничивает их эффективность при работе с сложными графиками. Необходим простой и улучшенный подход для разработки надежной модели для эффективного понимания и анализа графиков в разнообразных реальных сценариях.
ChartGemma: новая модель для улучшенного анализа графиков
Исследователи из Университета Йорка, Института искусственного интеллекта Квебека (MILA), Salesforce Research и Университета Наньянг разработали ChartGemma — продвинутую модель для понимания и анализа графиков. В отличие от существующих моделей, ChartGemma обучается на данных, сгенерированных непосредственно из изображений графиков, захватывая детальную визуальную информацию. Она основана на более компактной и эффективной архитектуре PaliGemma по сравнению с другими моделями. ChartGemma достигает лучших результатов в суммировании графиков, ответах на вопросы и проверке фактов на пяти бенчмарках.
ChartGemma использует архитектуру PaliGemma, оснащенную визионным энкодером SigLIP и языковой моделью Gemma-2B. Энкодер обрабатывает изображения размером 448×448 пикселей, преобразуя их в визуальные токены, которые затем комбинируются с текстовыми вложениями и обрабатываются моделью Gemma-2B. В отличие от существующих моделей анализа графиков, требующих двухэтапного обучения, ChartGemma использует одноэтапный метод, прямо настраивая данные обучения.
Преимущества ChartGemma
ChartGemma превосходит другие модели на большинстве задач, демонстрируя превосходную обобщаемость, особенно в понимании реалистичных инструкций и сложных графиков, несмотря на свой относительно небольшой размер.
Применение ИИ в продажах и маркетинге
Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ) и оставалась в числе лидеров, грамотно используйте ChartGemma: A Multimodal Model Instruction-Tuned on Data Generated Directly from a Diverse Range of Real-World Chart Images.
Проанализируйте, как ИИ может изменить вашу работу. Определите, где возможно применение автоматизации: найдите моменты, когда ваши клиенты могут извлечь выгоду из AI. Определитесь какие ключевые показатели эффективности (KPI): вы хотите улучшить с помощью ИИ.
Подберите подходящее решение, сейчас очень много вариантов ИИ. Внедряйте ИИ решения постепенно: начните с малого проекта, анализируйте результаты и KPI. На полученных данных и опыте расширяйте автоматизацию.
Если вам нужны советы по внедрению ИИ, пишите нам на https://t.me/itinai. Следите за новостями о ИИ в нашем Телеграм-канале t.me/itinainews или в Twitter @itinairu45358.
Попробуйте AI Sales Bot https://itinai.ru/aisales. Этот AI ассистент в продажах, помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж, снижать нагрузку на первую линию.
Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab itinai.ru будущее уже здесь!
Check out the Paper. All credit for this research goes to the researchers of this project. Also, don’t forget to follow us on Twitter.
Join our Telegram Channel and LinkedIn Group.
If you like our work, you will love our newsletter.
Don’t Forget to join our 46k+ ML SubReddit
The post ChartGemma: A Multimodal Model Instruction-Tuned on Data Generated Directly from a Diverse Range of Real-World Chart Images appeared first on MarkTechPost.
«`