Методи навчання з підкріпленням для управління агентами у реальному часі
dc.contributor.advisor | Недашківська, Надія Іванівна | |
dc.contributor.author | Ходаківський, Станіслав-Єгор Вячеславович | |
dc.date.accessioned | 2020-11-16T15:19:52Z | |
dc.date.available | 2020-11-16T15:19:52Z | |
dc.date.issued | 2020-06 | |
dc.description.abstracten | The work consists of: 96 pages., 20 images., 7 tables, 21 sources. This work is devoted to the topic of reinforced learning. It discusses the latest algorithms for training agents, frameworks for training these agents, ways to accelerate training. The aim of the work is to study and compare different reinforcement learning practices to further address weaknesses. The object of study is the game genre race. | uk |
dc.description.abstractuk | Дипломна робота: 96 с., 20 рис., 2 додаткіи, 7 табл., 21 джерело. Ця робота присвячена темі навчання з підкріпленням. У ній розглядаються найновіші алгоритми для навчання агентів, фреймворки для тренування цих агенвот, способи прискорення тренуваннь. Метою роботи є дослідження і порівняння різних практик навчання з підкріплення для подальшого усунення слабких сторін. Обектом дослідження є гра жанру гонка. | uk |
dc.format.page | 96 с. | uk |
dc.identifier.citation | Ходаківський, С.-Є. В. Методи навчання з підкріпленням для управління агентами у реальному часі : дипломна робота … бакалавра : 122 Комп'ютерні науки та інформаційні технології / Ходаківський Станіслав-Єгор Вячеславович. – Київ, 2020. – 96 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/37427 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | машинне навчання | uk |
dc.subject | навчання з підкріпленням | uk |
dc.subject | ігровий штучний інтелект | uk |
dc.subject | алгоритми пошуку політики | uk |
dc.subject | ЮНІТІ | uk |
dc.subject | machine learning | uk |
dc.subject | reinforsment learning | uk |
dc.subject | game artificial intelligence | uk |
dc.subject | policy search algorithms | uk |
dc.subject | UNIT | uk |
dc.title | Методи навчання з підкріпленням для управління агентами у реальному часі | uk |
dc.type | Bachelor Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Ескіз недоступний
- Назва:
- Khodakivski_bakalavr.docx
- Розмір:
- 1.43 MB
- Формат:
- Microsoft Word XML
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: