Рекомендаційні системи на основі навчання з підкріпленням
dc.contributor.advisor | Синєглазов, Віктор Михайлович | |
dc.contributor.author | Шеруда, Андрій Володимирович | |
dc.date.accessioned | 2023-09-16T12:02:20Z | |
dc.date.available | 2023-09-16T12:02:20Z | |
dc.date.issued | 2023 | |
dc.description.abstract | Об’єкт дослідження – рекомендаційні системи, а саме рекомендаційні агенти для пропонування кінокартин. Предмет дослідження – інтерпретації середовища навчання з підкріпленням в контексті рекомендаційних систем та самі моделі навчання з підкріпленням. Наукова значимість полягає в досліджені підходу впровадження рекомендаційних систем в контексті постановки задачі навчання з підкріпленням. Практична значимість полягає у розробці програмного забезпечення на основі вищезгаданого підходу для формування переліку пропозицій. Метою даної роботи є адаптувати алгоритми навчання з підкріпленням під проблематику рекомендаційних систем. Зокрема: Розглянути існуючі підходи до алгоритмів рекомендаційних систем, зокрема їх проблематику, складності їх запуску на реальних проектах та перепони під час збору необхідних навчальних даних. Проаналізувати Марківський процес прийняття рішень, оцінити його переваги в контексті рекомендаційних систем. Розглянути підходи для адаптації алгоритмів навчання з підкріпленням до задачі рекомендацій (перехід від задачі контрольованого навчання до задачі навчання з підкріпленням). Реалізувати алгоритми навчання з підкріпленням DDPG та TD3 з власним середовищем-імітацією реакції користувача та порівняти результати. | uk |
dc.description.abstractother | The object of research is recommender systems, namely recommender agents for recommending movies. The subject of the study is the interpretation of the reinforcement learning environment in the context of recommendation systems and the models of reinforcement learning. The scientific significance lies in the researched approach to the implementation of recommendation systems in the context of setting the task of reinforcement learning. The practical significance lies in the development of software based on the above-mentioned approach for forming a list of proposals. The purpose of this work is to adapt reinforcement learning algorithms to the problems of recommender systems. In particular: To consider the existing approaches to algorithms of recommender systems, in particular their problems, the complexity of their launch on real projects and the collection of the necessary training data. Analyze the Markov decision-making process, evaluate its advantages in the context of recommender systems. Consider approaches for adapting reinforcement learning algorithms to the task of recommendations (transition from the task of supervised learning to the task of reinforcement learning). Implement DDPG and TD3 reinforcement learning algorithms with your own user reaction simulation environment and compare the results. | uk |
dc.format.extent | 129 с. | uk |
dc.identifier.citation | Шеруда, А. В. Рекомендаційні системи на основі навчання з підкріпленням : дипломна робота ... бакалавра : 122 Комп'ютерні науки / Шеруда Андрій Володимирович. – Київ, 2023. – 129 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/60433 | |
dc.language.iso | uk | uk |
dc.publisher.place | Київ | uk |
dc.subject | рекомендаційні системи | uk |
dc.subject | навчання з підкріпленням | uk |
dc.subject | recommender systems | uk |
dc.subject | reinforcement learning | uk |
dc.title | Рекомендаційні системи на основі навчання з підкріпленням | uk |
dc.type | Bachelor Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Ескіз недоступний
- Назва:
- Sheruda_bakalavr.docx
- Розмір:
- 799.09 KB
- Формат:
- Microsoft Word XML
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: