Cистема аналізу думок користувачів інтернет для передбачення соціальної напруженості в суспільстві

dc.contributor.advisorТретиник, Віолета Вікентіївна
dc.contributor.authorНадь, Юлія Артурівна
dc.date.accessioned2024-06-13T08:41:15Z
dc.date.available2024-06-13T08:41:15Z
dc.date.issued2023
dc.description.abstractДипломна робота складається з 74 аркушів і включає 2 додатки та перелік посилань на використані джерела з 14 найменувань. У роботі наведено 23 рисунки та 5 таблиць. Метою дипломної роботи є розробка програмного забезпечення аналізу думок користувачів інтернет для передбачення соціальної напруженості в суспільстві. Для досягнення цієї мети було проведено докладний огляд методів аналізу соціальної напруженості, включаючи класичні методи оцінки трендів у суспільстві, такі як опитування рецензентів та методи машинного навчання, зокрема словникові методи, метод Наївного Баєсу, метод опорних векторів, та моделей векторного представлення слів у комбінації із алгоритмом кластеризації. Обрано останній метод, як найбільш оптимальний у вигляді моделей word2vec та k-means. Переваги підходу були визначені наступними критеріями: швидкість навчання, врахування контексту, якість аналізу українського тексту, можливість використання немічених даних. В ході дослідження було розроблено програмне рішення, яке здатне аналізувати текстові дані з метою виявлення соціальної напруженості. Створено архітектуру системи, яка включає обробку та векторизацію текстових даних, аналіз семантичних зв'язків між словами та кластеризацію для виявлення тематичних зв'язків. Результати можна використовувати для загального перегляду тренду напруженності в українському суспільстві, залежно від періоду, та передбачення кривої настрою у майбутньому.
dc.description.abstractotherThe thesis consists of 74 pages and includes 14 appendices and a list of references with 16 sources cited. The thesis contains 23 figures and 5 tables. The aim of the thesis is to develop a tool for analyzing social tensions in society. To achieve this goal, a detailed review of social tension analysis methods was conducted, including classic methods for assessing trends in society, such as peer review and machine learning methods, including dictionary methods, Naive Bayes method, support vector method, and vector word representation models in combination with clustering algorithm. The last method was chosen as the most optimal in the form of word2vec and k-means models. The advantages of the approach were determined by the following criteria: learning speed, taking into account the context, the quality of analysis of the Ukrainian text, the possibility of using unlabeled data. In the course of the research, a software solution was developed that is able to analyze text data in order to identify social tensions. The system architecture has been created, which includes processing and vectorization of text data, analysis of semantic relations between words, and clustering to identify thematic relations. The results can be used for a general overview of the trend of tension in Ukrainian society, depending on the period, and for predicting the mood curve in the future.
dc.format.extent102 с.
dc.identifier.citationНадь, Ю. А. Cистема аналізу думок користувачів інтернет для передбачення соціальної напруженості в суспільстві : дипломна робота … бакалавра : 113 Прикладна математика / Надь Юлія Артурівна. – Київ, 2023. – 102 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/67160
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectаналіз напруженості
dc.subjectсоціальна динаміка
dc.subjectмашинне навчання
dc.subjectобробка текстових даних
dc.subjectword2vec
dc.subjectk-means
dc.titleCистема аналізу думок користувачів інтернет для передбачення соціальної напруженості в суспільстві
dc.typeMaster Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Nad_bakalavr.pdf
Розмір:
4.51 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: