Аналiз ефективностi методiв навчання з пiдкрiпленням на прикладi гри Nidhogg

Вантажиться...
Ескіз

Дата

2021

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Метою даної дипломної роботи було дослідити ефективність програми, що базується на навчанні з підкріпленням у грі “Nidhogg”. Ця гра містить елементи людської психології, де гравці повинні передбачити, що зробить їхній опонент, щоб досягти фінішної точки. Це піднімає питання: "чи може нейронна мережа навчити себе бути непередбачуваною?". Чи вдасться їй перехитрити опонента? Або вона просто використовуватиме найнадійнішу стратегію в будь-яких ситуаціях? Щоб перевірити це, агент був реалізований з використанням бібліотеки для навчання з підкріпленням “Serpent.AI” для мови Python. Ця бібліотека також має спосіб візуалізації процесу навчання. Агенту дозволили зіграти 10000 матчів та порівняли з агентом, який діє випадково. Результати показали, що навчальний агент мав більше успіхів у спробах досягти мети, ніж той, який робив випадкові дії.

Опис

Ключові слова

Бібліографічний опис

Гридін, О. В. Аналiз ефективностi методiв навчання з пiдкрiпленням на прикладi гри Nidhogg : дипломний проект … бакалавра : 121 Інженерія програмного забезпечення / Гридін Олександр Вадимович. – Київ, 2021. – 59 с.

ORCID

DOI