Рекомендаційні системи на основі навчання з підкріпленням
Ескіз недоступний
Дата
2023
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
Об’єкт дослідження – рекомендаційні системи, а саме рекомендаційні агенти для пропонування кінокартин.
Предмет дослідження – інтерпретації середовища навчання з підкріпленням в контексті рекомендаційних систем та самі моделі навчання з підкріпленням.
Наукова значимість полягає в досліджені підходу впровадження рекомендаційних систем в контексті постановки задачі навчання з підкріпленням.
Практична значимість полягає у розробці програмного забезпечення на основі вищезгаданого підходу для формування переліку пропозицій.
Метою даної роботи є адаптувати алгоритми навчання з підкріпленням під проблематику рекомендаційних систем. Зокрема:
Розглянути існуючі підходи до алгоритмів рекомендаційних систем, зокрема їх проблематику, складності їх запуску на реальних проектах та перепони під час збору необхідних навчальних даних.
Проаналізувати Марківський процес прийняття рішень, оцінити його переваги в контексті рекомендаційних систем.
Розглянути підходи для адаптації алгоритмів навчання з підкріпленням до задачі рекомендацій (перехід від задачі контрольованого навчання до задачі навчання з підкріпленням).
Реалізувати алгоритми навчання з підкріпленням DDPG та TD3 з власним середовищем-імітацією реакції користувача та порівняти результати.
Опис
Ключові слова
рекомендаційні системи, навчання з підкріпленням, recommender systems, reinforcement learning
Бібліографічний опис
Шеруда, А. В. Рекомендаційні системи на основі навчання з підкріпленням : дипломна робота ... бакалавра : 122 Комп'ютерні науки / Шеруда Андрій Володимирович. – Київ, 2023. – 129 с.