
«`html
Несмотря на успех Vision Transformers (ViTs) в задачах, таких как классификация и генерация изображений, они сталкиваются с серьезными трудностями в решении абстрактных задач, связанных с отношениями между объектами. Основное ограничение заключается в том, что ViTs сложно точно выполнять визуальные реляционные задачи, например, определять, одинаковы ли два объекта.
Исследователи из Брауновского университета, Нью-Йоркского университета и Стэнфордского университета применяют методы механистической интерпретации, чтобы понять, как ViTs обрабатывают и представляют визуальные отношения. Они провели исследование, сосредоточенное на задаче определения идентичности двух визуальных объектов.
Модели ViTs, обученные на задачах «одинаковый-разный», продемонстрировали два этапа обработки. Первый этап включает извлечение локальных признаков объектов, а второй — сравнение этих представлений для определения реляционных свойств. Это указывает на то, что ViTs могут в некоторой степени представлять абстрактные отношения.
Исследование показывает, что ViTs используют двухступенчатый механизм для обработки визуальных отношений. На перцептивном этапе модель отделяет представления объектов, акцентируя внимание на таких признаках, как цвет и форма. Это упрощает выполнение реляционных операций на следующих этапах.
Преимущество этой двухступенчатой модели в том, что она позволяет ViTs достигать более структурированного подхода к реляционному мышлению, обеспечивая лучшую обобщаемость за пределами обучающих данных.
Результаты исследования освещают ограничения и потенциал Vision Transformers в задачах реляционного мышления. Двухступенчатая модель, состоящая из перцептивного и реляционного этапов, предлагает многообещающий подход к улучшению визуального восприятия.
Это исследование подчеркивает важность решения как перцептивных, так и реляционных недостатков в ViTs, чтобы обеспечить их способность обобщать обучение на новые контексты.
Если вы хотите, чтобы ваша компания развивалась с помощью искусственного интеллекта (ИИ), следуйте этим шагам:
Если вам нужны советы по внедрению ИИ, пишите нам в Телеграм.
Попробуйте AI Sales Bot — это AI ассистент для продаж, который помогает отвечать на вопросы клиентов и генерировать контент для отдела продаж.
Узнайте, как ИИ может изменить процесс продаж в вашей компании с решением от saile.ru. Будущее уже здесь!
«`
Оставьте заявку — мы свяжемся с вами и расскажем, как начать работу