Методи навчання з підкріпленням в динамічних іграх

Очкусь, Наум Ярославович

Методи навчання з підкріпленням в динамічних іграх

dc.contributor.advisor	Ігнатенко, Олексій Петрович
dc.contributor.author	Очкусь, Наум Ярославович
dc.date.accessioned	2020-03-11T08:32:47Z
dc.date.available	2020-03-11T08:32:47Z
dc.date.issued	2019-12
dc.description.abstract	Магістерська дисертація: 90 c., 4 ч., 23 табл., 14 рис., 12 джерел. Об‘єкт дослідження - навчання з підкріпленням, диференційні ігри такі як ігри переслідування. Мета роботи – доказати доцільність використання навчання з підкріпленням для розв‘язання диференційних ігор. Методи дослідження – моделювання різних форм ігор переслідування наприклад в яких є 1 переслідувач і 1 втікач та коли є один переслідувач та декілька втікачів, вирішення цих задач за допомогою теоретичних методів та методів навчання з підкріпленням. На основі зроблених досліджень були побудовані графіки і таблиці для порівняння алгоритмів та аналізу тренування алгоритму навчання з підкріпленням. Запропоновані автором методи можуть бути застосовані для моделювання та вирішення описаних задач ігрової взаємодії.	uk
dc.description.abstracten	Masters‘ thesis: 90 p., 4 p., 23 tables., 14 drawing., 12 sources. Object of study - reinforcement training, differential games such as pursuit games. The purpose of the work is to prove the feasibility of using reinforcement learning to solve differential games. Research Methods - Modeling various forms of pursuit games such as 1 pursuer and 1 fugitive and one persecutor and multiple fugitives, solving these problems using theoretical and reinforcement training methods. Based on the research, graphs and tables were constructed to compare the algorithms and to analyze the training of the reinforcement learning algorithm. The methods proposed by the author can be applied to simulate and solve the described problems of game interaction.	uk
dc.format.page	98 с.	uk
dc.identifier.citation	Очкусь, Н. Я. Методи навчання з підкріпленням в динамічних іграх : магістерська дис. : 122 Комп'ютерні науки / Очкусь Наум Ярославович. - Київ, 2019. - 98 с.	uk
dc.identifier.uri	https://ela.kpi.ua/handle/123456789/32190
dc.language.iso	uk	uk
dc.publisher	КПІ ім. Ігоря Сікорського	uk
dc.publisher.place	Київ	uk
dc.subject	навчання з підкріпленням	uk
dc.subject	диференційна гра	uk
dc.subject	гра переслідування	uk
dc.subject	reinforcemnt learning	uk
dc.subject	differential game	uk
dc.subject	pursuit-evasion game	uk
dc.subject	q-learning	uk
dc.subject	policy gradient	uk
dc.subject	actor-critic method	uk
dc.subject	ddpg	uk
dc.subject.udc	004.853	uk
dc.title	Методи навчання з підкріпленням в динамічних іграх	uk
dc.type	Master Thesis	uk

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: Ochkus_magistr.pdf
Розмір:: 1.97 MB
Формат:: Adobe Portable Document Format
Опис:

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 9.06 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Магістерські роботи (ММСА)
Магістерські роботи