
«`html
Автономная навигация в Интернете с использованием искусственного интеллекта
Автономная навигация в Интернете направлена на разработку ИИ-агентов, способных выполнять сложные онлайн-задачи. Эти задачи включают в себя поиск данных, отправку форм, а также более сложные действия, такие как поиск самых дешевых билетов или бронирование размещения. За счет использования больших языковых моделей (LLM) и других методов ИИ, автономная навигация в Интернете нацелена на увеличение производительности как в потребительской, так и корпоративной сферах путем автоматизации типично ручных и трудоемких задач.
Проблемы и решения
Исследование решает основную проблему текущих Интернет-агентов, которые неэффективны и подвержены ошибкам. Традиционные Интернет-агенты не справляются с шумными и обширными моделями объектов документов (DOM) HTML и динамичным характером современных веб-страниц. Они часто не могут выполнять задачи точно из-за неспособности эффективно обрабатывать сложность и изменчивость веб-контента. Эта неэффективность является значительным препятствием для практического применения автономных Интернет-агентов в реальных приложениях, где надежность и точность имеют ключевое значение.
Инновационные подходы
Исследователи в Emergence AI представили Agent-E, новый Интернет-агент, разработанный для преодоления недостатков существующих систем. Иерархическая архитектура Agent-E разделяет фазы планирования и выполнения задач на два отдельных компонента: планирующий агент и агент навигации браузера. Это разделение позволяет каждому компоненту сосредоточиться на своей конкретной роли, что улучшает эффективность и производительность. Планирующий агент разбивает задачи на подзадачи, которые затем выполняются агентом навигации браузера с использованием передовых техник дистилляции DOM.
Результаты и перспективы
Оценка по бенчмарку WebVoyager показала, что Agent-E значительно превосходит предыдущие современные Интернет-агенты. Agent-E достиг успеха в 73,2%, обозначая улучшение на 20% по сравнению с предыдущими текстовыми веб-агентами и на 16% в сравнении с мультимодальными веб-агентами. На сложных сайтах, таких как Wolfram Alpha, улучшение производительности Agent-E достигло 30%. Кроме успеха, исследовательская команда сообщила о дополнительных метриках, таких как время выполнения задач и осведомленность об ошибках. Agent-E в среднем затрачивал 150 секунд на успешное выполнение задачи и 220 секунд на неудачные задачи. Для выполнения каждой задачи в среднем требовалось 25 вызовов LLM, что подчеркивает его эффективность и эффективность.
Исследование проведенное в Emergence AI представляет собой значительный прогресс в автономной навигации в Интернете. Agent-E устанавливает новый стандарт производительности и надежности путем решения неэффективности текущих Интернет-агентов с помощью иерархической архитектуры и передовых методов управления DOM. Достижения исследования указывают на то, что эти инновации могут быть применены в других областях автоматизации, предлагая ценные идеи в области принципов проектирования агентных систем. Успех Agent-E в достижении 73,2% успеха выполнения задач и эффективный процесс выполнения задач подчеркивает его потенциал для изменения автономной навигации и автоматизации в Интернете.
Автор статьи: исследователи проекта.
Следите за нами в Twitter, присоединяйтесь к нам в Telegram-канале и группе LinkedIn. Если вам понравилась наша работа, вам понравится наша рассылка.
Не забудьте присоединиться к нашему сообществу в ML SubReddit.
Найдите предстоящие вебинары по ИИ здесь.
«`
*Перевод между тегами в HTML был выполнен, чтобы сохранить форматирование текста. Если HTML теги не нужны, предоставьте текстовую версию, и я с удовольствием переведу его.*