Ігнатенко, Олексій ПетровичЄлісєєв, Владислав Вікторович2020-11-092020-11-092020-06Єлісєєв, В. В. Методи навчання з підкріпленням в комбінаторних іграх двох учасників : дипломна робота ... бакалавра : 124 Системний аналіз / Єлісєєв Владислав Вікторович. – Київ, 2020. – 101 с.https://ela.kpi.ua/handle/123456789/37260Дипломна робота: 101 с., 43 рис., 6 табл., 2 додатки, 32 джерел. Об’єктом дослідження є комбінаторні ігри двох осіб з повною інформацією, де складність пошуку стратегії полягає у великий кількості стратегій та траєкторій гри, що ускладнює пошук оптимальної стратегії. Метою дослідження є огляд останніх досягнень науки у сфері навчання з підкріпленням, розгляд можливості застосування методів навчання з підкріпленням до задач пошуку стратегій гри у комбінаторних іграх. Предмет дослідження: методи глибокого навчання з підкріпленням для вирішення задачі пошуку виграшної стратегії у комбінаторних іграх та їх застосування на конкретних прикладах. Дослідження ґрунтується на наукових публікаціях та інших матеріалах закордонних конференцій та архівів в галузі машинного навчання, глибокого навчання та глибокого навчання з підкріпленням і пошуку виграшних стратегій в іграх. Програмна реалізація моделі та інфраструктури навчання написана мовою Python, з використанням фреймворку TensorFlow та OpenSpiel.ukагентвиграшна стратегіяглубоке навчаннякомбінаторна грамарковський процес прийняття рішеньнаближена оптимізація стратегіїнавчання з підкріпленнямagentwinning strategydeep learningcombinatorial gamemarkov decision-making processapproximal strategy optimizationreinforcement learningМетоди навчання з підкріпленням в комбінаторних іграх двох учасниківBachelor Thesis101 с.