Математичне та програмне забезпечення підсистеми виявлення фейкових новин

dc.contributor.advisorЛюбашенко, Наталія Дмитрівна
dc.contributor.authorДовгаль, Єва Олександрівна
dc.date.accessioned2024-06-11T08:13:15Z
dc.date.available2024-06-11T08:13:15Z
dc.date.issued2023
dc.description.abstractДипломну роботу виконано на 68 аркушах, вона містить 2 додатки та перелік посилань на використані джерела з 20 найменувань. У роботі наведено 23 рисунків та 3 таблиці. Метою даної дипломної роботи є розробка математичних та програмних засобів для розпізнавання фейкової інформації в текстових даних. У роботі проведено аналіз різних моделей машинного навчання, включаючи логістичну регресію, наївний класифікатор Баєса, нейромережі з використанням згорткових (CNN), рекурентних (RNN) та довготривалих (LSTM) шарів. Також були розглянуті різні методи векторизації тексту, зокрема Bag of Words, TF-IDF, Word2Vec та GloVe. У процесі роботи було порівняно ефективність цих моделей та методів векторизації такими метриками, як accuracy, precision, recall, f1-score. Для кожної моделі були розроблені та налаштовані відповідні алгоритми навчання. Здійснено тестування розроблених систем з використанням реальних наборів даних з відкритих джерел (Kaggle), що містили фейкову та правдиву інформацію. Отримані результати підтверджують ефективність використання машинного навчання для розпізнавання фейкової інформації, зокрема LSTM, який в результаті показав точність 94,5%. Результати цієї роботи можуть бути використані для подальшого вдосконалення та розробки подібних систем.
dc.description.abstractotherThe thesis is presented in 68 pages. It contains 2 appendixes and bibliography of 20 references. 23 figures and 3 tables are given in the thesis. The purpose of this thesis is to develop mathematical and software tools for recognizing fake information in textual data. The paper analyzes various machine learning models, including logistic regression, naive Bayes classifier, neural networks using convolutional (CNN), recurrent (RNN) and long short-term memory (LSTM) layers. Various text vectorization methods were also considered, including Bag of Words, TF-IDF, Word2Vec, and GloVe. During the work, the efficiency of these models and vectorization methods was compared using such metrics as accuracy, precision, recall, f1-score. Appropriate learning algorithms were developed and configured for each model. The developed systems were tested using real data sets from open sources (Kaggle), which contained fake and true information. The obtained results confirm the effectiveness of using machine learning to recognize fake information, in particular LSTM, which as a result showed an precision of 94.5%. The results of this work can be used for further improvement and development of similar systems.
dc.format.extent85 с.
dc.identifier.citationДовгаль, Є. О. Математичне та програмне забезпечення підсистеми виявлення фейкових новин : дипломна робота … бакалавра : 113 Прикладна математика / Довгаль Єва Олександрівна. – Київ, 2023. – 85 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/67079
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectфейкова інформація
dc.subjectмашинне навчання
dc.subjectлогістична регресія
dc.subjectнаївний класифікатор Баєса
dc.subjectнейромережі
dc.subjectCNN
dc.subjectRNN
dc.subjectLSTM
dc.subjectвекторизація тексту
dc.subjectTF-IDF
dc.subjectWord2Vec
dc.subjectGloVe
dc.titleМатематичне та програмне забезпечення підсистеми виявлення фейкових новин
dc.typeBachelor Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Dovhal_bakalavr.pdf
Розмір:
4.05 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: