Comparison of “Online-Q” and “Experience Replay” for Training a Neural Network in a Multi-Agent Environment

Shunin, E.V.

Сравнение Online-Q и Experience Replay для обучения нейронной сети в мультиагентной среде

В данной работе проводится сравнение двух методов обучения с подкреплением, а именно Online-Q и Experience replay. Сравнение проведено для агента, обучаемого в мультиагентной среде, которая представляет собой видеоигру “mitos.is”. При использовании нейронной сети в обучении с подкреплением возникают трудности с высокой корреляцией между примерами, которая осложняет обучение агента. Таким образом использование experience replay позволяет работать с независимыми примерами. В ходе проведенного сравнения выявлено преимущество experience replay для данной среды.

Comparison of “Online-Q” and “Experience Replay” for Training a Neural Network in a Multi-Agent Environment

In this paper, two training methods with reinforcement learning are compared, namely Online-Q and Experience replay. A comparison was made for an agent trained in a multi-agent environment, which is a video game "mitos.is". When using a neural network in reinforced learning, difficulties arise with a high correlation between the examples, which complicates the training of the agent. Thus, using experience replay gives independent examples. Comparison reveals the advantage of experience replay for this environment.

Authors

Шунин Е.В. (Shunin E.V.) ¹

Conference proceedings

Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: материалы Всероссийской конференции с международным участием. Москва, РУДН, 16–20 апреля 2018 г.

Publisher

РУДН

Language

Russian

Pages

407-409

State

Published

Organizations

¹ Peoples' Friendship University of Russia

Keywords

neural networks; reinforcement learning; information technologies; conference proceedings; Q-learning; нейронные сети; обучение с подкреплением; Q обучение; информационные технологии; проведение конференции

Cite

ГОСТ MLA RIS BibTex

INVERSE PROBLEM FOR THE EQUATION MANAGEMENTSCOPE

Article

Lesik P.A., Romanov A.A., Chistotina D.A.

ПРИОРИТЕТЫ РОССИЙСКО-ИСПАНСКОГО СОТРУДНИЧЕСТВА НА РУБЕЖЕ ХХ-ХХI ВВ

Article

Кузнецова В.В.

Роль и значение РУДН в системе международного образования. P.. 53-58

Сравнение Online-Q и Experience Replay для обучения нейронной сети в мультиагентной среде

Comparison of “Online-Q” and “Experience Replay” for Training a Neural Network in a Multi-Agent Environment

Other records

INVERSE PROBLEM FOR THE EQUATION MANAGEMENTSCOPE

ПРИОРИТЕТЫ РОССИЙСКО-ИСПАНСКОГО СОТРУДНИЧЕСТВА НА РУБЕЖЕ ХХ-ХХI ВВ

Cite