Методи навчання з підкріпленням в динамічних іграх
Вантажиться...
Дата
2019-12
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Магістерська дисертація: 90 c., 4 ч., 23 табл., 14 рис., 12 джерел.
Об‘єкт дослідження - навчання з підкріпленням, диференційні ігри такі як ігри переслідування.
Мета роботи – доказати доцільність використання навчання з підкріпленням для розв‘язання диференційних ігор.
Методи дослідження – моделювання різних форм ігор переслідування наприклад в яких є 1 переслідувач і 1 втікач та коли є один переслідувач та декілька втікачів, вирішення цих задач за допомогою теоретичних методів та методів навчання з підкріпленням.
На основі зроблених досліджень були побудовані графіки і таблиці для порівняння алгоритмів та аналізу тренування алгоритму навчання з підкріпленням.
Запропоновані автором методи можуть бути застосовані для моделювання та вирішення описаних задач ігрової взаємодії.
Опис
Ключові слова
навчання з підкріпленням, диференційна гра, гра переслідування, reinforcemnt learning, differential game, pursuit-evasion game, q-learning, policy gradient, actor-critic method, ddpg
Бібліографічний опис
Очкусь, Н. Я. Методи навчання з підкріпленням в динамічних іграх : магістерська дис. : 122 Комп'ютерні науки / Очкусь Наум Ярославович. - Київ, 2019. - 98 с.