Рекомендаційні системи на основі навчання з підкріпленням

Ескіз недоступний

Дата

2023

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Об’єкт дослідження – рекомендаційні системи, а саме рекомендаційні агенти для пропонування кінокартин. Предмет дослідження – інтерпретації середовища навчання з підкріпленням в контексті рекомендаційних систем та самі моделі навчання з підкріпленням. Наукова значимість полягає в досліджені підходу впровадження рекомендаційних систем в контексті постановки задачі навчання з підкріпленням. Практична значимість полягає у розробці програмного забезпечення на основі вищезгаданого підходу для формування переліку пропозицій. Метою даної роботи є адаптувати алгоритми навчання з підкріпленням під проблематику рекомендаційних систем. Зокрема: Розглянути існуючі підходи до алгоритмів рекомендаційних систем, зокрема їх проблематику, складності їх запуску на реальних проектах та перепони під час збору необхідних навчальних даних. Проаналізувати Марківський процес прийняття рішень, оцінити його переваги в контексті рекомендаційних систем. Розглянути підходи для адаптації алгоритмів навчання з підкріпленням до задачі рекомендацій (перехід від задачі контрольованого навчання до задачі навчання з підкріпленням). Реалізувати алгоритми навчання з підкріпленням DDPG та TD3 з власним середовищем-імітацією реакції користувача та порівняти результати.

Опис

Ключові слова

рекомендаційні системи, навчання з підкріпленням, recommender systems, reinforcement learning

Бібліографічний опис

Шеруда, А. В. Рекомендаційні системи на основі навчання з підкріпленням : дипломна робота ... бакалавра : 122 Комп'ютерні науки / Шеруда Андрій Володимирович. – Київ, 2023. – 129 с.

DOI