Метод автоматизованого визначення образливого вмісту текстових повідомлень в соціальних мережах

dc.contributor.advisorЗаболотня, Тетяна Миколаївна
dc.contributor.authorСоколовська, Анна Віталіївна
dc.date.accessioned2018-06-25T22:08:52Z
dc.date.available2018-06-25T22:08:52Z
dc.date.issued2018
dc.description.abstractenThis thesis is devoted to the automated detection of abusive content, and, in particular, the development of the method for detection of abusive content in social media text messages. In this work the study of specifics of web users publications in social media was completed and summary of characteristics which can be considered while detecting the abusive content was formed. The analysis of process of detection of abusive content in text data was performed from the point of view of possibility of considering the specifics of social media users’ messages, namely the modification of text pre-processing stages and analysis of results of classification was introduced. The method for detection of abusive content of social media users’ messages was developed on the basis of integrated consideration of social media messages’ characteristics and the specifics of relationships between different groups of social media visitors. Essentially novel in this work is the introduction of specific incoming data format for classifier and consideration of emoji for detection of abusive content. On the basis of the research theoretical material that describes the proposed method was presented and the software implementation of the following method was developed. In this thesis comparative analysis is performed and the results of performance of proposed method and method of automated detection of abusive content without modifications are presented.uk
dc.description.abstractukДана дисертація присвячена дослідженню автоматизованого визначення образливого вмісту в текстових даних та, зокрема, розробленню методу визначення образливого вмісту текстових повідомлень в соціальних мережах. У роботі виконано вивчення специфіки публікацій Інтернет-користувачів у соціальних мережах та сформовано перелік їх характеристик, які можуть бути враховані під час визначення образливого вмісту. Проведено аналіз процесу детекції образливого вмісту текстових даних з точки зору можливості урахування в ньому специфіки повідомлень користувачів соціальних мереж, а саме запропоновано модифікацію етапів передоброблення тексту та аналізу результатів класифікації. Розроблено метод визначення образливого вмісту повідомлень Інтернет-користувачів в соціальних мережах на основі комплексного урахування характеристик повідомлень в соціальних мережах та специфіки стосунків між різними групами відвідувачів соціальних мереж. Істотно новим в роботі є запровадження специфічного формату вхідних даних для класифікатора та врахування емодзі для визначення образливого вмісту. На основі проведеного дослідження було викладено теоретичний матеріал, що описує запропонований метод, та програмно реалізовано запропонований метод. У даній дисертації виконано порівняльну характеристику та надано результати роботи запропонованого методу та методу автоматизованого визначення образливого вмісту без модифікацій.uk
dc.format.page119 с.uk
dc.identifier.citationСоколовська, А. В. Метод автоматизованого визначення образливого вмісту текстових повідомлень в соціальних мережах : магістерська дис. : 121 Інженерія програмного забезпечення / Соколовська Анна Віталіївна. – Київ, 2018. – 119 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/23658
dc.language.isoukuk
dc.publisher.placeКиївuk
dc.subjectобразливий вмістuk
dc.subjectоброблення текстових данихuk
dc.subjectсоціальні мережіuk
dc.subjectмашинне навчанняuk
dc.subjectпередоброблення природномовних текстових данихuk
dc.titleМетод автоматизованого визначення образливого вмісту текстових повідомлень в соціальних мережахuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Sokolovska_magistr.pdf
Розмір:
1.65 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
7.74 KB
Формат:
Item-specific license agreed upon to submission
Опис: