Класифікація контенту Twitter-стрічки на основі алгоритмів машинного навчання
Вантажиться...
Дата
2019-12
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Обсяг роботи 71 сторінка, 28 ілюстрацій, 1 таблиця, 3 додатки, 16 джерел літератури.
Об’єктом дослідження є обробка природних мов з використанням методів машинного навчання.
Предметом дослідження є класифікація тексту повідомлень користувачів соціальної мережі Твітер за допомогою машинного навчання.
Обсяг інформації що з’являється в мережі інтернет росте з кожним днем. Останнім часом більша частина контенту в мережі складає контент, згенерований користувачами в соціальних мережах. Однією із важливих функцій соціальних мереж, є класифікація контенту користувачів і рекомендаційна стрічка на основі вподобань користувачів, яка в тій чи іншій мірі реалізована в кожній з популярних сьогодні мереж.
Класифікацією текстової інформації займається такий напрям інформатики, як обробка природної мови. Людська мова транслюється в векторні представлення і за допомогою математичної лінгвістики, машинного навчання та штучного інтелекту природний текст стає зрозумілим для машин.
Результатом роботи є розроблена розподілена система з мікросервісною архітектурою, яка в режимі реального часу може отримувати повідомлення з Твітеру за вказаними фільтрами та класифікувати їх вміст за різними показниками.
Опис
Ключові слова
обробка природної мови, Твітер, машинне навчання, класифікатор, розподілені системи, natural language processing, Twitter, machine learning, classifier, distributed systems
Бібліографічний опис
Топчій, Д. А. Класифікація контенту Twitter-стрічки на основі алгоритмів машинного навчання : магістерська дис. : 113 Прикладна математика / Топчій Данило Анатолійович. – Київ, 2019. – 71 с.