Методи навчання з підкріпленням в динамічних іграх

Очкусь, Наум Ярославович

Методи навчання з підкріпленням в динамічних іграх

Файли

Ochkus_magistr.pdf (1.97 MB)

Дата

2019-12

Автори

Очкусь, Наум Ярославович

Науковий керівник

Ігнатенко, Олексій Петрович

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Магістерська дисертація: 90 c., 4 ч., 23 табл., 14 рис., 12 джерел. Об‘єкт дослідження - навчання з підкріпленням, диференційні ігри такі як ігри переслідування. Мета роботи – доказати доцільність використання навчання з підкріпленням для розв‘язання диференційних ігор. Методи дослідження – моделювання різних форм ігор переслідування наприклад в яких є 1 переслідувач і 1 втікач та коли є один переслідувач та декілька втікачів, вирішення цих задач за допомогою теоретичних методів та методів навчання з підкріпленням. На основі зроблених досліджень були побудовані графіки і таблиці для порівняння алгоритмів та аналізу тренування алгоритму навчання з підкріпленням. Запропоновані автором методи можуть бути застосовані для моделювання та вирішення описаних задач ігрової взаємодії.

Ключові слова

навчання з підкріпленням, диференційна гра, гра переслідування, reinforcemnt learning, differential game, pursuit-evasion game, q-learning, policy gradient, actor-critic method, ddpg

Бібліографічний опис

Очкусь, Н. Я. Методи навчання з підкріпленням в динамічних іграх : магістерська дис. : 122 Комп'ютерні науки / Очкусь Наум Ярославович. - Київ, 2019. - 98 с.

URI

https://ela.kpi.ua/handle/123456789/32190

Зібрання

Магістерські роботи (ММСА)
Магістерські роботи

Повна інформація про документ

Методи навчання з підкріпленням в динамічних іграх

Файли

Дата

Автори

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Опис

Ключові слова

Бібліографічний опис

URI

DOI

Зібрання