Методи навчання з підкріпленням в комбінаторних іграх двох учасників

dc.contributor.advisorІгнатенко, Олексій Петрович
dc.contributor.authorЄлісєєв, Владислав Вікторович
dc.date.accessioned2020-11-09T08:51:38Z
dc.date.available2020-11-09T08:51:38Z
dc.date.issued2020-06
dc.description.abstractenThesis work: 101 pp., 43 fig., 6 tabl., 2 app., 32 sources. The object of the study is combinatorial games of two people with complete information, where the difficulty of finding a strategy lies in the large number of strategies and game trajectories, which complicates the search for the optimal strategy. The purpose of the study is to review the latest advances in science in the field of reinforcement learning, to consider the possibility of applying methods of reinforcement learning to the tasks of finding game strategies in combinatorial games. Subject of research: methods of deep learning with reinforcement to solve the problem of finding a winning strategy in combinatorial games and their application on specific examples. The research is based on scientific publications and other materials of foreign conferences and archives in the field of machine learning, deep learning and deep reinforcement learning and winning strategy optimization in games. The software implementation of the model and learning infrastructure is written in Python, using the TensorFlow and OpenSpiel frameworks.uk
dc.description.abstractukДипломна робота: 101 с., 43 рис., 6 табл., 2 додатки, 32 джерел. Об’єктом дослідження є комбінаторні ігри двох осіб з повною інформацією, де складність пошуку стратегії полягає у великий кількості стратегій та траєкторій гри, що ускладнює пошук оптимальної стратегії. Метою дослідження є огляд останніх досягнень науки у сфері навчання з підкріпленням, розгляд можливості застосування методів навчання з підкріпленням до задач пошуку стратегій гри у комбінаторних іграх. Предмет дослідження: методи глибокого навчання з підкріпленням для вирішення задачі пошуку виграшної стратегії у комбінаторних іграх та їх застосування на конкретних прикладах. Дослідження ґрунтується на наукових публікаціях та інших матеріалах закордонних конференцій та архівів в галузі машинного навчання, глибокого навчання та глибокого навчання з підкріпленням і пошуку виграшних стратегій в іграх. Програмна реалізація моделі та інфраструктури навчання написана мовою Python, з використанням фреймворку TensorFlow та OpenSpiel.uk
dc.format.page101 с.uk
dc.identifier.citationЄлісєєв, В. В. Методи навчання з підкріпленням в комбінаторних іграх двох учасників : дипломна робота ... бакалавра : 124 Системний аналіз / Єлісєєв Владислав Вікторович. – Київ, 2020. – 101 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/37260
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectагентuk
dc.subjectвиграшна стратегіяuk
dc.subjectглубоке навчанняuk
dc.subjectкомбінаторна граuk
dc.subjectмарковський процес прийняття рішеньuk
dc.subjectнаближена оптимізація стратегіїuk
dc.subjectнавчання з підкріпленнямuk
dc.subjectagentuk
dc.subjectwinning strategyuk
dc.subjectdeep learninguk
dc.subjectcombinatorial gameuk
dc.subjectmarkov decision-making processuk
dc.subjectapproximal strategy optimizationuk
dc.subjectreinforcement learninguk
dc.titleМетоди навчання з підкріпленням в комбінаторних іграх двох учасниківuk
dc.typeBachelor Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Yelisieiev_bakalavr.pdf
Розмір:
2.42 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: