Методи навчання з підкріпленням для гри в покер
dc.contributor.advisor | Недашківська, Надія Іванівна | |
dc.contributor.author | Туголукова, Євгенія Валеріївна | |
dc.date.accessioned | 2021-04-14T17:01:13Z | |
dc.date.available | 2021-04-14T17:01:13Z | |
dc.date.issued | 2020 | |
dc.description.abstracten | Master's thesis: 105 pages, 16 figures, 20 tables, 1 appendixes, 43 sources. The object of the work are imperfect information games, on the example of No-limit Texas hold'em for two players. The subject of the work is reinforcement learning methods for solving games with incomplete information. The purpose and goals of the work – to consider the theoretical basis of games with incomplete information, to study existing methods of solving them, to develop software that can optimally solve individual situations in No-limit Texas Hold'em, and game in general, analysis of the developed software. The research is based on scientific publications and other materials of foreign conferences and archives in the field of reinforcement learning, deep learning and finding winning strategies in games. The result is a client for playing No-limit Texas Hold'em, which can automatically make decisions in game situations. | uk |
dc.description.abstractuk | Магістерська дисертація: 105 с., 16 рис., 20 табл., 1 додаток, 43 джерела. Об’єктом дослідження є ігри з неповною інформацією, на прикладі безлімітного техаського холдему для двох гравців. Предметом дослідження є методи навчання з підкріпленням для розв'язування ігор з неповною інформацією. Мета та цілі роботи – розглянути теоретичне підґрунтя ігор з неповною інформацією, провести дослідження існуючих методів їх розв'язування, розробка програмного забезпечення, яке вміє оптимально розв'язувати окремі ситуації в безлімітному техаському холдемі, та ігрові партії в цілому, аналіз розробленого програмного продукту. Дослідження ґрунтується на наукових публікаціях та інших матеріалах закордонних конференцій та архівів в галузі навчання з підкріпленням, глибокого навчання та пошуку виграшних стратегій в іграх. Результатом роботи є клієнт для гри у безлімітний техаський холдем, що автоматично може приймати рішення у ігрових ситуаціях. | uk |
dc.format.page | 114 с. | uk |
dc.identifier.citation | Туголукова, Є. В. Методи навчання з підкріпленням для гри в покер : магістерська дис. : 122 Комп'ютерні науки / Туголукова Євгенія Валеріївна. – Київ, 2020. – 114 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/40598 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | гра з неповною інформацією | uk |
dc.subject | розширена форма гри | uk |
dc.subject | рівновага неша | uk |
dc.subject | навчання з підкріпленням | uk |
dc.subject | співставлення шкодувань | uk |
dc.subject | контрфактичні шкодування | uk |
dc.subject | іmperfect information game | uk |
dc.subject | extensive-form game | uk |
dc.subject | nash equilibrium | uk |
dc.subject | reinforcement learning | uk |
dc.subject | regret matching | uk |
dc.subject | counterfactual regret | uk |
dc.subject.udc | 004.855.5:519.876.2 | uk |
dc.title | Методи навчання з підкріпленням для гри в покер | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Tuholukova_magistr.pdf
- Розмір:
- 3.18 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.01 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: