Рекомендаційна система для медіа-платформ з використанням методів глибокого навчання

dc.contributor.advisorКисельов, Геннадій Дмитрович
dc.contributor.authorМазурік, Олексій Юрійович
dc.date.accessioned2019-03-27T16:47:13Z
dc.date.available2019-03-27T16:47:13Z
dc.date.issued2018
dc.description.abstractenThe thesis contains 103 pages, 39 figures, 17 tables, 20 references, and 1 appendix (12 pages). Relevance. Recommender systems appeared on the modern IT-market as a tool for replacing the static list of recommendations for searching or shopping on the different web-platforms. These systems form a rated list of the objects (goods, films, songs), based on various criteria: relevance, popularity, history of assessments, and users’ likes. As there is a lot of information in the modern world, it is important to have quality tools for personalized filtering of large data like recommender systems. With the current popularization and rapid development of the machine learning, artificial intelligence is responsible for the core of any solid personalized system. Therefore, now the construction of a recommender system using modern techniques of in-depth training - building models based on multilayer neural networks - is a very important question to discuss. Purpose. The purpose of this paper is to find the ways to improve existing solutions for building recommender systems for media platforms using new approaches to in-depth training. The goal of the study is to implement a system of media content recommendations that uses modern and effective methods that have advantages over known static methods without the use of neural networks. Results. It was suggested to use the SkipGram model, which uses multi-layer neural networks to search for semantic links between different videos. This usage of this model is quite unusual since the main scope of the Word2Vec algorithm is the search for semantic links between the words. This "innovative" use of the model makes it possible to build accurate vector representations of video in the 32-dimensional space of semantic connections. Also, this model makes it easy to build a recommendatory system of media content based on the received data. This model was tested on the dataset containing sessions of the users' video-viewing on the synthetic video service. The experiment was also conducted to build the recommender system using the model data. Object of research. Multilayer neural networks; Word2Vec, SkipGram and CBoW models. Subject of research. Machine learning methods for building word embeddings. Research methods. Two-layer and three-layer neural networks are explored and applied. For the construction of vector representations, the SkipGram and CBoW models are investigated. The developed solution uses modern machine learning models and approaches to architecture their architecture development; methods and techniques for training, improving accuracy and robustness; libraries for implementation and distributed training. Scientific novelty It was suggested to use the SkipGram model architecture to search for the semantic links between the different videos. This model of Word2Vec has not yet been used in the published open source paper to build recommendations for media content since Word2Vec's primary task is to search for links between words. This model showed better results than static recommendations based on the estimates because with it you can see a lot of hidden links between the videos. Some methods to improve the model's performance using optimized techniques for building a Word2Vec model have also been proposed, meta-data video (title, keywords, estimates) and the video content itself (convolutional neural networks will find the dependency here, but in this case the task will be reduced to solving the new combined NLP + Computer Vision task). Practical value. The developed model allows you to search for hidden links between different videos to build an accurate and relevant recommender system that can be embedded into any existing web-system since the implementation has a detailed and simple API and userfriendly interface (UI) on Redux.uk
dc.description.abstractukЗагальний обсяг роботи: 103 сторінки, 39 ілюстрацій, 17 таблиць, перелік посилань із 20 найменувань, 1 додаток на 12 сторінках. Актуальність теми. Рекомендаційні системи з’явилися на сучасному ринку ІТ як механізм для заміни статичному списку рекомендацій при пошуку або покупках на веб-сайтах. Ці системи формують рейтинговий перелік об’єктів (товарів, фільмів, музичних композицій) на основі різних критеріїв: релевантність, популярність, історія оцінок тощо. Оскільки інформації у сучасному світі стало багато, тому важливо мати якісні інструменти для персоналізованої фільтрації великих даних, якими і виступають рекомендаційні системи. З великою популяризацією та швидким розвитком машинного навчання штучний інтелект відповідає за ядро будь-якої серйозної персоналізованої системи. Тому зараз побудова рекомендаційної системи з використанням сучасних методів глибокого навчання – побудови моделей на основі багатошарових нейронних мереж – є нагальним питанням. Мета та задачі дослідження. Метою даної роботи є пошук шляхів удосконалення існуючих рішень побудови рекомендаційних систем для медіа платформ із застосуванням нових підходів глибокого навчання. Задачею дослідження є реалізація системи рекомендацій медіаконтенту, яка використовує нові та більш ефективні методи, що мають переваги перед відомими методами без використання нейронних мереж. Вирішення поставлених завдань та досягнуті результати Було запропоновано використати модель SkipGram, що використовує багатошарові нейронні мережі, для пошуку семантичних зв’язків між різними відео. Це застосування є досить нестандартним, оскільки основна область застосування алгоритму Word2Vec є пошук семантичних зв’язків між словами. Таке використання моделі дозволяє побудувати точні векторні представлення відео у 32-вимірному просторі семантичних зв’язків. Також дана модель дозволяє легко побудувати рекомендаційну систему медіа-контенту на основі отриманих даних. Дану модель було випробувано на наборі даних, що містить сесії переглядів користувачами відео синтетичного відео-сервісу. Також було проведено експеримент з побудови рекомендаційної системи з використанням даних моделі. Об’єкт дослідження. Багатошарові нейронні мережі, моделі Word2Vec, SkipGram та CBoW. Предмет дослідження. Методи машинного навчання для побудови word embeddings. Методи дослідження. Досліджуються та застосовуються дво- та тришарові нейронні мережі. Для побудови векторних представлень досліджуються моделі SkipGram та CBoW. Розроблене рішення використовує сучасні моделі машинного навчання та підходи до розробки їх архітектур; методи та техніки навчання, покращення точності та стійкості; а також бібліотеки для їх реалізації та розподіленого тренування. Наукова новизна. Було запропоновано архітектуру моделі SkipGram для пошуку семантичних зв’язків між різними відео. Дану модель Word2Vec ще не було використано в опублікованих роботах для побудови рекомендацій медіа-контенту, оскільки першочерговою задачею Word2Vec є пошук зв’язків між словами. Дана модель показала кращі результати, ніж статичні рекомендації на основі оцінок, оскільки за допомогою неї можна побачити багато прихованих зв’язків між відео. Також було запропоновано методі для покращення результатів роботи моделі з використанням ще кращих методів для побудови моделі Word2Vec, мета-даних відео (назва, ключові слова, оцінки) та самого контенту відео (згорткові нейронні мережі дадуть змогу знайти залежність і тут, але в цьому випадку задачу буде зведено до вирішення нової вже Computer Vision задачі). Практичне значення одержаних результатів. Розроблена модель дозволяє виконувати пошук прихованих зв’язків між різними відео для побудови точної та релевантної рекомендаційної системи, яку можна вбудувати до будь-якої існуючої веб-системи, оскільки реалізація має детально описане API та зручний користувацький інтерфейс (UI) на Redux.uk
dc.format.page103 c.uk
dc.identifier.citationМазурік, О. Ю. Рекомендаційна система для медіа-платформ з використанням методів глибокого навчання : магістерська дис. : 122 Комп’ютерні науки та інформаційні технології (Системне проектування сервісів) / Мазурік Олексій Юрійович. – Київ, 2018. – 103 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/26948
dc.language.isoukuk
dc.publisher.placeКиївuk
dc.subjectмашинне навчанняuk
dc.subjectнейронні мережіuk
dc.subjectрекомендації відеоuk
dc.subjectмодель Word2Vecuk
dc.subjectзгорткові нейронні мережіuk
dc.subjectмодель SkipGramuk
dc.subjectвекторні представленняuk
dc.subjectPyTorchuk
dc.subjectTensorFlowuk
dc.subjectрозподілене тренуванняuk
dc.subjectmachine learninguk
dc.subjectneural networksuk
dc.subjectvideo recommendationsuk
dc.subjectconvolutional neural networksuk
dc.subjectword embeddingsuk
dc.subjectdistributed traininguk
dc.subjectWord2Vec modeluk
dc.subjectSkipGram modeluk
dc.subject.udc004.457uk
dc.titleРекомендаційна система для медіа-платформ з використанням методів глибокого навчанняuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Mazurik_magistr.pdf
Розмір:
5.6 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.18 KB
Формат:
Item-specific license agreed upon to submission
Опис: