Методи навчання з підкріпленням в комбінаторних іграх двох учасників
Вантажиться...
Дата
2020-06
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Дипломна робота: 101 с., 43 рис., 6 табл., 2 додатки, 32 джерел.
Об’єктом дослідження є комбінаторні ігри двох осіб з повною
інформацією, де складність пошуку стратегії полягає у великий кількості
стратегій та траєкторій гри, що ускладнює пошук оптимальної стратегії.
Метою дослідження є огляд останніх досягнень науки у сфері навчання
з підкріпленням, розгляд можливості застосування методів навчання з
підкріпленням до задач пошуку стратегій гри у комбінаторних іграх.
Предмет дослідження: методи глибокого навчання з підкріпленням для
вирішення задачі пошуку виграшної стратегії у комбінаторних іграх та їх
застосування на конкретних прикладах.
Дослідження ґрунтується на наукових публікаціях та інших матеріалах
закордонних конференцій та архівів в галузі машинного навчання, глибокого
навчання та глибокого навчання з підкріпленням і пошуку виграшних
стратегій в іграх.
Програмна реалізація моделі та інфраструктури навчання написана
мовою Python, з використанням фреймворку TensorFlow та OpenSpiel.
Опис
Ключові слова
агент, виграшна стратегія, глубоке навчання, комбінаторна гра, марковський процес прийняття рішень, наближена оптимізація стратегії, навчання з підкріпленням, agent, winning strategy, deep learning, combinatorial game, markov decision-making process, approximal strategy optimization, reinforcement learning
Бібліографічний опис
Єлісєєв, В. В. Методи навчання з підкріпленням в комбінаторних іграх двох учасників : дипломна робота ... бакалавра : 124 Системний аналіз / Єлісєєв Владислав Вікторович. – Київ, 2020. – 101 с.