Методи навчання з підкріпленням в комбінаторних іграх двох учасників

Вантажиться...
Ескіз

Дата

2020-06

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Дипломна робота: 101 с., 43 рис., 6 табл., 2 додатки, 32 джерел. Об’єктом дослідження є комбінаторні ігри двох осіб з повною інформацією, де складність пошуку стратегії полягає у великий кількості стратегій та траєкторій гри, що ускладнює пошук оптимальної стратегії. Метою дослідження є огляд останніх досягнень науки у сфері навчання з підкріпленням, розгляд можливості застосування методів навчання з підкріпленням до задач пошуку стратегій гри у комбінаторних іграх. Предмет дослідження: методи глибокого навчання з підкріпленням для вирішення задачі пошуку виграшної стратегії у комбінаторних іграх та їх застосування на конкретних прикладах. Дослідження ґрунтується на наукових публікаціях та інших матеріалах закордонних конференцій та архівів в галузі машинного навчання, глибокого навчання та глибокого навчання з підкріпленням і пошуку виграшних стратегій в іграх. Програмна реалізація моделі та інфраструктури навчання написана мовою Python, з використанням фреймворку TensorFlow та OpenSpiel.

Опис

Ключові слова

агент, виграшна стратегія, глубоке навчання, комбінаторна гра, марковський процес прийняття рішень, наближена оптимізація стратегії, навчання з підкріпленням, agent, winning strategy, deep learning, combinatorial game, markov decision-making process, approximal strategy optimization, reinforcement learning

Бібліографічний опис

Єлісєєв, В. В. Методи навчання з підкріпленням в комбінаторних іграх двох учасників : дипломна робота ... бакалавра : 124 Системний аналіз / Єлісєєв Владислав Вікторович. – Київ, 2020. – 101 с.

ORCID

DOI