Методи навчання з підкріпленням в комбінаторних іграх двох учасників
dc.contributor.advisor | Ігнатенко, Олексій Петрович | |
dc.contributor.author | Єлісєєв, Владислав Вікторович | |
dc.date.accessioned | 2020-11-09T08:51:38Z | |
dc.date.available | 2020-11-09T08:51:38Z | |
dc.date.issued | 2020-06 | |
dc.description.abstracten | Thesis work: 101 pp., 43 fig., 6 tabl., 2 app., 32 sources. The object of the study is combinatorial games of two people with complete information, where the difficulty of finding a strategy lies in the large number of strategies and game trajectories, which complicates the search for the optimal strategy. The purpose of the study is to review the latest advances in science in the field of reinforcement learning, to consider the possibility of applying methods of reinforcement learning to the tasks of finding game strategies in combinatorial games. Subject of research: methods of deep learning with reinforcement to solve the problem of finding a winning strategy in combinatorial games and their application on specific examples. The research is based on scientific publications and other materials of foreign conferences and archives in the field of machine learning, deep learning and deep reinforcement learning and winning strategy optimization in games. The software implementation of the model and learning infrastructure is written in Python, using the TensorFlow and OpenSpiel frameworks. | uk |
dc.description.abstractuk | Дипломна робота: 101 с., 43 рис., 6 табл., 2 додатки, 32 джерел. Об’єктом дослідження є комбінаторні ігри двох осіб з повною інформацією, де складність пошуку стратегії полягає у великий кількості стратегій та траєкторій гри, що ускладнює пошук оптимальної стратегії. Метою дослідження є огляд останніх досягнень науки у сфері навчання з підкріпленням, розгляд можливості застосування методів навчання з підкріпленням до задач пошуку стратегій гри у комбінаторних іграх. Предмет дослідження: методи глибокого навчання з підкріпленням для вирішення задачі пошуку виграшної стратегії у комбінаторних іграх та їх застосування на конкретних прикладах. Дослідження ґрунтується на наукових публікаціях та інших матеріалах закордонних конференцій та архівів в галузі машинного навчання, глибокого навчання та глибокого навчання з підкріпленням і пошуку виграшних стратегій в іграх. Програмна реалізація моделі та інфраструктури навчання написана мовою Python, з використанням фреймворку TensorFlow та OpenSpiel. | uk |
dc.format.page | 101 с. | uk |
dc.identifier.citation | Єлісєєв, В. В. Методи навчання з підкріпленням в комбінаторних іграх двох учасників : дипломна робота ... бакалавра : 124 Системний аналіз / Єлісєєв Владислав Вікторович. – Київ, 2020. – 101 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/37260 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | агент | uk |
dc.subject | виграшна стратегія | uk |
dc.subject | глубоке навчання | uk |
dc.subject | комбінаторна гра | uk |
dc.subject | марковський процес прийняття рішень | uk |
dc.subject | наближена оптимізація стратегії | uk |
dc.subject | навчання з підкріпленням | uk |
dc.subject | agent | uk |
dc.subject | winning strategy | uk |
dc.subject | deep learning | uk |
dc.subject | combinatorial game | uk |
dc.subject | markov decision-making process | uk |
dc.subject | approximal strategy optimization | uk |
dc.subject | reinforcement learning | uk |
dc.title | Методи навчання з підкріпленням в комбінаторних іграх двох учасників | uk |
dc.type | Bachelor Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Yelisieiev_bakalavr.pdf
- Розмір:
- 2.42 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: