Itinai.com it company office background blured photography by 83d4babd 14b1 46f9 81ea 8a75bac63327 0
Itinai.com it company office background blured photography by 83d4babd 14b1 46f9 81ea 8a75bac63327 0

Моделирование накопления культурных знаний у искусственных агентов с подкреплением

 Modeling Cultural Accumulation in Artificial Reinforcement Learning Agents

«`html

Моделирование культурного накопления в искусственных агентах обучения с подкреплением

Культурное накопление, способность учиться и накапливать знания на протяжении нескольких поколений, считается ключевым фактором успеха человека. Однако текущие методы в системах искусственного обучения, таких как глубокое обучение с подкреплением (RL), обычно рассматривают проблему обучения как происходящую за одну «жизнь». Этот подход не учитывает поколенческую и бесконечную природу культурного накопления, наблюдаемую у людей и других видов. Достижение эффективного культурного накопления в искусственных агентах представляет существенные вызовы, включая балансировку социального обучения от других агентов с независимым исследованием и открытием, а также работу на нескольких временных шкалах, регулирующих приобретение знаний, навыков и технологических достижений.

Предлагаемые решения

Исследователи предлагают устойчивый подход, который балансирует социальное обучение от других агентов с независимым исследованием, позволяя культурное накопление в искусственных агентах обучения с подкреплением. Они создают две различные модели для изучения этого накопления в различных поколениях: эпизодические поколения для изучения в контексте (накопление знаний) и поколения обучения для изучения весов (накопление навыков). Строя правильный баланс между этими двумя механизмами, агенты могут непрерывно накапливать знания и навыки на протяжении нескольких поколений, превосходя агентов, обученных за одну жизнь, с тем же накопленным опытом.

Результаты демонстрируют эффективность предложенных моделей культурного накопления в превосходстве над базовыми моделями обучения с подкреплением за одну жизнь по нескольким средам.

Ключевые находки

— Культурное накопление в контексте может быть затруднено оракулами, которые слишком надежны или ненадежны, требуя баланса между социальным обучением и независимым открытием.

— Накопление весов эффективно смягчает приматический биас.

— Сброс сети дополнительно улучшает производительность накопления весов.

Подробнее ознакомьтесь с исследованием.

Вся заслуга за это исследование принадлежит исследователям этого проекта. Также не забудьте подписаться на нас в Twitter. Присоединяйтесь к нашему каналу в Telegram, Discord и группе в LinkedIn.

Если вам нравится наша работа, вам понравится наша рассылка.

Не забудьте присоединиться к нашему сообществу в Reddit. Также ознакомьтесь с нашей платформой AI Events Platform.

Попробуйте AI Sales Bot здесь. Этот AI ассистент в продажах помогает отвечать на вопросы клиентов, генерировать контент для отдела продаж и снижать нагрузку на первую линию.

Узнайте, как ИИ может изменить ваши процессы с решениями от AI Lab здесь. Будущее уже здесь!

«`

Бесплатный ИИ: для автоматизации продаж

Умные продажи