Рекомендаційна система для медіа-платформ з використанням методів глибокого навчання
Дата
2018
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
Загальний обсяг роботи: 103 сторінки, 39 ілюстрацій, 17 таблиць, перелік
посилань із 20 найменувань, 1 додаток на 12 сторінках.
Актуальність теми.
Рекомендаційні системи з’явилися на сучасному ринку ІТ як механізм для
заміни статичному списку рекомендацій при пошуку або покупках на веб-сайтах. Ці
системи формують рейтинговий перелік об’єктів (товарів, фільмів, музичних
композицій) на основі різних критеріїв: релевантність, популярність, історія оцінок
тощо. Оскільки інформації у сучасному світі стало багато, тому важливо мати якісні
інструменти для персоналізованої фільтрації великих даних, якими і виступають
рекомендаційні системи.
З великою популяризацією та швидким розвитком машинного навчання
штучний інтелект відповідає за ядро будь-якої серйозної персоналізованої системи.
Тому зараз побудова рекомендаційної системи з використанням сучасних методів
глибокого навчання – побудови моделей на основі багатошарових нейронних
мереж – є нагальним питанням.
Мета та задачі дослідження.
Метою даної роботи є пошук шляхів удосконалення існуючих рішень побудови
рекомендаційних систем для медіа платформ із застосуванням нових підходів
глибокого навчання. Задачею дослідження є реалізація системи рекомендацій медіаконтенту, яка використовує нові та більш ефективні методи, що мають переваги перед
відомими методами без використання нейронних мереж.
Вирішення поставлених завдань та досягнуті результати
Було запропоновано використати модель SkipGram, що використовує
багатошарові нейронні мережі, для пошуку семантичних зв’язків між різними відео.
Це застосування є досить нестандартним, оскільки основна область застосування
алгоритму Word2Vec є пошук семантичних зв’язків між словами. Таке використання
моделі дозволяє побудувати точні векторні представлення відео у 32-вимірному
просторі семантичних зв’язків. Також дана модель дозволяє легко побудувати
рекомендаційну систему медіа-контенту на основі отриманих даних.
Дану модель було випробувано на наборі даних, що містить сесії переглядів
користувачами відео синтетичного відео-сервісу. Також було проведено експеримент
з побудови рекомендаційної системи з використанням даних моделі.
Об’єкт дослідження.
Багатошарові нейронні мережі, моделі Word2Vec, SkipGram та CBoW.
Предмет дослідження.
Методи машинного навчання для побудови word embeddings.
Методи дослідження.
Досліджуються та застосовуються дво- та тришарові нейронні мережі. Для
побудови векторних представлень досліджуються моделі SkipGram та CBoW.
Розроблене рішення використовує сучасні моделі машинного навчання та
підходи до розробки їх архітектур; методи та техніки навчання, покращення точності
та стійкості; а також бібліотеки для їх реалізації та розподіленого тренування.
Наукова новизна.
Було запропоновано архітектуру моделі SkipGram для пошуку семантичних
зв’язків між різними відео. Дану модель Word2Vec ще не було використано в
опублікованих роботах для побудови рекомендацій медіа-контенту, оскільки
першочерговою задачею Word2Vec є пошук зв’язків між словами. Дана модель
показала кращі результати, ніж статичні рекомендації на основі оцінок, оскільки за
допомогою неї можна побачити багато прихованих зв’язків між відео. Також було
запропоновано методі для покращення результатів роботи моделі з використанням
ще кращих методів для побудови моделі Word2Vec, мета-даних відео (назва, ключові
слова, оцінки) та самого контенту відео (згорткові нейронні мережі дадуть змогу
знайти залежність і тут, але в цьому випадку задачу буде зведено до вирішення нової
вже Computer Vision задачі).
Практичне значення одержаних результатів.
Розроблена модель дозволяє виконувати пошук прихованих зв’язків між
різними відео для побудови точної та релевантної рекомендаційної системи, яку
можна вбудувати до будь-якої існуючої веб-системи, оскільки реалізація має
детально описане API та зручний користувацький інтерфейс (UI) на Redux.
Опис
Ключові слова
машинне навчання, нейронні мережі, рекомендації відео, модель Word2Vec, згорткові нейронні мережі, модель SkipGram, векторні представлення, PyTorch, TensorFlow, розподілене тренування, machine learning, neural networks, video recommendations, convolutional neural networks, word embeddings, distributed training, Word2Vec model, SkipGram model
Бібліографічний опис
Мазурік, О. Ю. Рекомендаційна система для медіа-платформ з використанням методів глибокого навчання : магістерська дис. : 122 Комп’ютерні науки та інформаційні технології (Системне проектування сервісів) / Мазурік Олексій Юрійович. – Київ, 2018. – 103 с.