Методи навчання з підкріпленням в динамічних іграх

dc.contributor.advisorІгнатенко, Олексій Петрович
dc.contributor.authorОчкусь, Наум Ярославович
dc.date.accessioned2020-03-11T08:32:47Z
dc.date.available2020-03-11T08:32:47Z
dc.date.issued2019-12
dc.description.abstractenMasters‘ thesis: 90 p., 4 p., 23 tables., 14 drawing., 12 sources. Object of study - reinforcement training, differential games such as pursuit games. The purpose of the work is to prove the feasibility of using reinforcement learning to solve differential games. Research Methods - Modeling various forms of pursuit games such as 1 pursuer and 1 fugitive and one persecutor and multiple fugitives, solving these problems using theoretical and reinforcement training methods. Based on the research, graphs and tables were constructed to compare the algorithms and to analyze the training of the reinforcement learning algorithm. The methods proposed by the author can be applied to simulate and solve the described problems of game interaction.uk
dc.description.abstractukМагістерська дисертація: 90 c., 4 ч., 23 табл., 14 рис., 12 джерел. Об‘єкт дослідження - навчання з підкріпленням, диференційні ігри такі як ігри переслідування. Мета роботи – доказати доцільність використання навчання з підкріпленням для розв‘язання диференційних ігор. Методи дослідження – моделювання різних форм ігор переслідування наприклад в яких є 1 переслідувач і 1 втікач та коли є один переслідувач та декілька втікачів, вирішення цих задач за допомогою теоретичних методів та методів навчання з підкріпленням. На основі зроблених досліджень були побудовані графіки і таблиці для порівняння алгоритмів та аналізу тренування алгоритму навчання з підкріпленням. Запропоновані автором методи можуть бути застосовані для моделювання та вирішення описаних задач ігрової взаємодії.uk
dc.format.page98 с.uk
dc.identifier.citationОчкусь, Н. Я. Методи навчання з підкріпленням в динамічних іграх : магістерська дис. : 122 Комп'ютерні науки / Очкусь Наум Ярославович. - Київ, 2019. - 98 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/32190
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectнавчання з підкріпленнямuk
dc.subjectдиференційна граuk
dc.subjectгра переслідуванняuk
dc.subjectreinforcemnt learninguk
dc.subjectdifferential gameuk
dc.subjectpursuit-evasion gameuk
dc.subjectq-learninguk
dc.subjectpolicy gradientuk
dc.subjectactor-critic methoduk
dc.subjectddpguk
dc.subject.udc004.853uk
dc.titleМетоди навчання з підкріпленням в динамічних іграхuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Ochkus_magistr.pdf
Розмір:
1.97 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.06 KB
Формат:
Item-specific license agreed upon to submission
Опис: