Методи навчання з підкріпленням в динамічних іграх
dc.contributor.advisor | Ігнатенко, Олексій Петрович | |
dc.contributor.author | Очкусь, Наум Ярославович | |
dc.date.accessioned | 2020-03-11T08:32:47Z | |
dc.date.available | 2020-03-11T08:32:47Z | |
dc.date.issued | 2019-12 | |
dc.description.abstracten | Masters‘ thesis: 90 p., 4 p., 23 tables., 14 drawing., 12 sources. Object of study - reinforcement training, differential games such as pursuit games. The purpose of the work is to prove the feasibility of using reinforcement learning to solve differential games. Research Methods - Modeling various forms of pursuit games such as 1 pursuer and 1 fugitive and one persecutor and multiple fugitives, solving these problems using theoretical and reinforcement training methods. Based on the research, graphs and tables were constructed to compare the algorithms and to analyze the training of the reinforcement learning algorithm. The methods proposed by the author can be applied to simulate and solve the described problems of game interaction. | uk |
dc.description.abstractuk | Магістерська дисертація: 90 c., 4 ч., 23 табл., 14 рис., 12 джерел. Об‘єкт дослідження - навчання з підкріпленням, диференційні ігри такі як ігри переслідування. Мета роботи – доказати доцільність використання навчання з підкріпленням для розв‘язання диференційних ігор. Методи дослідження – моделювання різних форм ігор переслідування наприклад в яких є 1 переслідувач і 1 втікач та коли є один переслідувач та декілька втікачів, вирішення цих задач за допомогою теоретичних методів та методів навчання з підкріпленням. На основі зроблених досліджень були побудовані графіки і таблиці для порівняння алгоритмів та аналізу тренування алгоритму навчання з підкріпленням. Запропоновані автором методи можуть бути застосовані для моделювання та вирішення описаних задач ігрової взаємодії. | uk |
dc.format.page | 98 с. | uk |
dc.identifier.citation | Очкусь, Н. Я. Методи навчання з підкріпленням в динамічних іграх : магістерська дис. : 122 Комп'ютерні науки / Очкусь Наум Ярославович. - Київ, 2019. - 98 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/32190 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | навчання з підкріпленням | uk |
dc.subject | диференційна гра | uk |
dc.subject | гра переслідування | uk |
dc.subject | reinforcemnt learning | uk |
dc.subject | differential game | uk |
dc.subject | pursuit-evasion game | uk |
dc.subject | q-learning | uk |
dc.subject | policy gradient | uk |
dc.subject | actor-critic method | uk |
dc.subject | ddpg | uk |
dc.subject.udc | 004.853 | uk |
dc.title | Методи навчання з підкріпленням в динамічних іграх | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Ochkus_magistr.pdf
- Розмір:
- 1.97 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.06 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: