Методи навчання з підкріпленням для гри в покер

Вантажиться...
Ескіз

Дата

2020

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Магістерська дисертація: 105 с., 16 рис., 20 табл., 1 додаток, 43 джерела. Об’єктом дослідження є ігри з неповною інформацією, на прикладі безлімітного техаського холдему для двох гравців. Предметом дослідження є методи навчання з підкріпленням для розв'язування ігор з неповною інформацією. Мета та цілі роботи – розглянути теоретичне підґрунтя ігор з неповною інформацією, провести дослідження існуючих методів їх розв'язування, розробка програмного забезпечення, яке вміє оптимально розв'язувати окремі ситуації в безлімітному техаському холдемі, та ігрові партії в цілому, аналіз розробленого програмного продукту. Дослідження ґрунтується на наукових публікаціях та інших матеріалах закордонних конференцій та архівів в галузі навчання з підкріпленням, глибокого навчання та пошуку виграшних стратегій в іграх. Результатом роботи є клієнт для гри у безлімітний техаський холдем, що автоматично може приймати рішення у ігрових ситуаціях.

Опис

Ключові слова

гра з неповною інформацією, розширена форма гри, рівновага неша, навчання з підкріпленням, співставлення шкодувань, контрфактичні шкодування, іmperfect information game, extensive-form game, nash equilibrium, reinforcement learning, regret matching, counterfactual regret

Бібліографічний опис

Туголукова, Є. В. Методи навчання з підкріпленням для гри в покер : магістерська дис. : 122 Комп'ютерні науки / Туголукова Євгенія Валеріївна. – Київ, 2020. – 114 с.

DOI