Методи навчання з підкріпленням для гри в покер

dc.contributor.advisorНедашківська, Надія Іванівна
dc.contributor.authorТуголукова, Євгенія Валеріївна
dc.date.accessioned2021-04-14T17:01:13Z
dc.date.available2021-04-14T17:01:13Z
dc.date.issued2020
dc.description.abstractenMaster's thesis: 105 pages, 16 figures, 20 tables, 1 appendixes, 43 sources. The object of the work are imperfect information games, on the example of No-limit Texas hold'em for two players. The subject of the work is reinforcement learning methods for solving games with incomplete information. The purpose and goals of the work – to consider the theoretical basis of games with incomplete information, to study existing methods of solving them, to develop software that can optimally solve individual situations in No-limit Texas Hold'em, and game in general, analysis of the developed software. The research is based on scientific publications and other materials of foreign conferences and archives in the field of reinforcement learning, deep learning and finding winning strategies in games. The result is a client for playing No-limit Texas Hold'em, which can automatically make decisions in game situations.uk
dc.description.abstractukМагістерська дисертація: 105 с., 16 рис., 20 табл., 1 додаток, 43 джерела. Об’єктом дослідження є ігри з неповною інформацією, на прикладі безлімітного техаського холдему для двох гравців. Предметом дослідження є методи навчання з підкріпленням для розв'язування ігор з неповною інформацією. Мета та цілі роботи – розглянути теоретичне підґрунтя ігор з неповною інформацією, провести дослідження існуючих методів їх розв'язування, розробка програмного забезпечення, яке вміє оптимально розв'язувати окремі ситуації в безлімітному техаському холдемі, та ігрові партії в цілому, аналіз розробленого програмного продукту. Дослідження ґрунтується на наукових публікаціях та інших матеріалах закордонних конференцій та архівів в галузі навчання з підкріпленням, глибокого навчання та пошуку виграшних стратегій в іграх. Результатом роботи є клієнт для гри у безлімітний техаський холдем, що автоматично може приймати рішення у ігрових ситуаціях.uk
dc.format.page114 с.uk
dc.identifier.citationТуголукова, Є. В. Методи навчання з підкріпленням для гри в покер : магістерська дис. : 122 Комп'ютерні науки / Туголукова Євгенія Валеріївна. – Київ, 2020. – 114 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/40598
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectгра з неповною інформацієюuk
dc.subjectрозширена форма гриuk
dc.subjectрівновага нешаuk
dc.subjectнавчання з підкріпленнямuk
dc.subjectспівставлення шкодуваньuk
dc.subjectконтрфактичні шкодуванняuk
dc.subjectіmperfect information gameuk
dc.subjectextensive-form gameuk
dc.subjectnash equilibriumuk
dc.subjectreinforcement learninguk
dc.subjectregret matchinguk
dc.subjectcounterfactual regretuk
dc.subject.udc004.855.5:519.876.2uk
dc.titleМетоди навчання з підкріпленням для гри в покерuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Tuholukova_magistr.pdf
Розмір:
3.18 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.01 KB
Формат:
Item-specific license agreed upon to submission
Опис: