Кочур, Юрій ПетровичГридін, Олександр Вадимович2021-07-292021-07-292021Гридін, О. В. Аналiз ефективностi методiв навчання з пiдкрiпленням на прикладi гри Nidhogg : дипломний проект … бакалавра : 121 Інженерія програмного забезпечення / Гридін Олександр Вадимович. – Київ, 2021. – 59 с.https://ela.kpi.ua/handle/123456789/42788Метою даної дипломної роботи було дослідити ефективність програми, що базується на навчанні з підкріпленням у грі “Nidhogg”. Ця гра містить елементи людської психології, де гравці повинні передбачити, що зробить їхній опонент, щоб досягти фінішної точки. Це піднімає питання: "чи може нейронна мережа навчити себе бути непередбачуваною?". Чи вдасться їй перехитрити опонента? Або вона просто використовуватиме найнадійнішу стратегію в будь-яких ситуаціях? Щоб перевірити це, агент був реалізований з використанням бібліотеки для навчання з підкріпленням “Serpent.AI” для мови Python. Ця бібліотека також має спосіб візуалізації процесу навчання. Агенту дозволили зіграти 10000 матчів та порівняли з агентом, який діє випадково. Результати показали, що навчальний агент мав більше успіхів у спробах досягти мети, ніж той, який робив випадкові дії.ukАналiз ефективностi методiв навчання з пiдкрiпленням на прикладi гри NidhoggBachelor Thesis59 с.