Методи навчання з підкріпленням в динамічних іграх

Вантажиться...
Ескіз

Дата

2019-12

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Магістерська дисертація: 90 c., 4 ч., 23 табл., 14 рис., 12 джерел. Об‘єкт дослідження - навчання з підкріпленням, диференційні ігри такі як ігри переслідування. Мета роботи – доказати доцільність використання навчання з підкріпленням для розв‘язання диференційних ігор. Методи дослідження – моделювання різних форм ігор переслідування наприклад в яких є 1 переслідувач і 1 втікач та коли є один переслідувач та декілька втікачів, вирішення цих задач за допомогою теоретичних методів та методів навчання з підкріпленням. На основі зроблених досліджень були побудовані графіки і таблиці для порівняння алгоритмів та аналізу тренування алгоритму навчання з підкріпленням. Запропоновані автором методи можуть бути застосовані для моделювання та вирішення описаних задач ігрової взаємодії.

Опис

Ключові слова

навчання з підкріпленням, диференційна гра, гра переслідування, reinforcemnt learning, differential game, pursuit-evasion game, q-learning, policy gradient, actor-critic method, ddpg

Бібліографічний опис

Очкусь, Н. Я. Методи навчання з підкріпленням в динамічних іграх : магістерська дис. : 122 Комп'ютерні науки / Очкусь Наум Ярославович. - Київ, 2019. - 98 с.

DOI