Методи навчання з підкріпленням для гри в покер
Вантажиться...
Дата
2020
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Магістерська дисертація: 105 с., 16 рис., 20 табл., 1 додаток, 43 джерела.
Об’єктом дослідження є ігри з неповною інформацією, на прикладі
безлімітного техаського холдему для двох гравців.
Предметом дослідження є методи навчання з підкріпленням для
розв'язування ігор з неповною інформацією.
Мета та цілі роботи – розглянути теоретичне підґрунтя ігор з неповною
інформацією, провести дослідження існуючих методів їх розв'язування,
розробка програмного забезпечення, яке вміє оптимально розв'язувати окремі
ситуації в безлімітному техаському холдемі, та ігрові партії в цілому, аналіз
розробленого програмного продукту.
Дослідження ґрунтується на наукових публікаціях та інших матеріалах
закордонних конференцій та архівів в галузі навчання з підкріпленням,
глибокого навчання та пошуку виграшних стратегій в іграх.
Результатом роботи є клієнт для гри у безлімітний техаський холдем, що
автоматично може приймати рішення у ігрових ситуаціях.
Опис
Ключові слова
гра з неповною інформацією, розширена форма гри, рівновага неша, навчання з підкріпленням, співставлення шкодувань, контрфактичні шкодування, іmperfect information game, extensive-form game, nash equilibrium, reinforcement learning, regret matching, counterfactual regret
Бібліографічний опис
Туголукова, Є. В. Методи навчання з підкріпленням для гри в покер : магістерська дис. : 122 Комп'ютерні науки / Туголукова Євгенія Валеріївна. – Київ, 2020. – 114 с.