
«`html
Моделирование культурного накопления в искусственных агентах обучения с подкреплением
Культурное накопление, способность учиться и накапливать знания на протяжении нескольких поколений, считается ключевым фактором успеха человека. Однако текущие методы в системах искусственного обучения, таких как глубокое обучение с подкреплением (RL), обычно рассматривают проблему обучения как происходящую за одну «жизнь». Этот подход не учитывает поколенческую и бесконечную природу культурного накопления, наблюдаемую у людей и других видов. Достижение эффективного культурного накопления в искусственных агентах представляет существенные вызовы, включая балансировку социального обучения от других агентов с независимым исследованием и открытием, а также работу на нескольких временных шкалах, регулирующих приобретение знаний, навыков и технологических достижений.
Предлагаемые решения
Исследователи предлагают устойчивый подход, который балансирует социальное обучение от других агентов с независимым исследованием, позволяя культурное накопление в искусственных агентах обучения с подкреплением. Они создают две различные модели для изучения этого накопления в различных поколениях: эпизодические поколения для изучения в контексте (накопление знаний) и поколения обучения для изучения весов (накопление навыков). Строя правильный баланс между этими двумя механизмами, агенты могут непрерывно накапливать знания и навыки на протяжении нескольких поколений, превосходя агентов, обученных за одну жизнь, с тем же накопленным опытом.
Результаты демонстрируют эффективность предложенных моделей культурного накопления в превосходстве над базовыми моделями обучения с подкреплением за одну жизнь по нескольким средам.
Ключевые находки
— Культурное накопление в контексте может быть затруднено оракулами, которые слишком надежны или ненадежны, требуя баланса между социальным обучением и независимым открытием.
— Накопление весов эффективно смягчает приматический биас.
— Сброс сети дополнительно улучшает производительность накопления весов.
Подробнее ознакомьтесь с исследованием.
Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на нас в Twitter. Присоединяйтесь к нашему каналу в Telegram, Discord и группе в LinkedIn.
Если вам нравится наша работа, вам понравится наша рассылка.
Не забудьте присоединиться к нашему сообществу в Reddit. Также ознакомьтесь с нашей платформой AI Events Platform.
Попробуйте AI Sales Bot здесь. Этот AI ассистент в продажах помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж и снижать нагрузку на первую линию.
Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab здесь. Будущее уже здесь!
«`