Математичне та програмне забезпечення підсистеми виявлення фейкових новин

Довгаль, Єва Олександрівна

Математичне та програмне забезпечення підсистеми виявлення фейкових новин

dc.contributor.advisor	Любашенко, Наталія Дмитрівна
dc.contributor.author	Довгаль, Єва Олександрівна
dc.date.accessioned	2024-06-11T08:13:15Z
dc.date.available	2024-06-11T08:13:15Z
dc.date.issued	2023
dc.description.abstract	Дипломну роботу виконано на 68 аркушах, вона містить 2 додатки та перелік посилань на використані джерела з 20 найменувань. У роботі наведено 23 рисунків та 3 таблиці. Метою даної дипломної роботи є розробка математичних та програмних засобів для розпізнавання фейкової інформації в текстових даних. У роботі проведено аналіз різних моделей машинного навчання, включаючи логістичну регресію, наївний класифікатор Баєса, нейромережі з використанням згорткових (CNN), рекурентних (RNN) та довготривалих (LSTM) шарів. Також були розглянуті різні методи векторизації тексту, зокрема Bag of Words, TF-IDF, Word2Vec та GloVe. У процесі роботи було порівняно ефективність цих моделей та методів векторизації такими метриками, як accuracy, precision, recall, f1-score. Для кожної моделі були розроблені та налаштовані відповідні алгоритми навчання. Здійснено тестування розроблених систем з використанням реальних наборів даних з відкритих джерел (Kaggle), що містили фейкову та правдиву інформацію. Отримані результати підтверджують ефективність використання машинного навчання для розпізнавання фейкової інформації, зокрема LSTM, який в результаті показав точність 94,5%. Результати цієї роботи можуть бути використані для подальшого вдосконалення та розробки подібних систем.
dc.description.abstractother	The thesis is presented in 68 pages. It contains 2 appendixes and bibliography of 20 references. 23 figures and 3 tables are given in the thesis. The purpose of this thesis is to develop mathematical and software tools for recognizing fake information in textual data. The paper analyzes various machine learning models, including logistic regression, naive Bayes classifier, neural networks using convolutional (CNN), recurrent (RNN) and long short-term memory (LSTM) layers. Various text vectorization methods were also considered, including Bag of Words, TF-IDF, Word2Vec, and GloVe. During the work, the efficiency of these models and vectorization methods was compared using such metrics as accuracy, precision, recall, f1-score. Appropriate learning algorithms were developed and configured for each model. The developed systems were tested using real data sets from open sources (Kaggle), which contained fake and true information. The obtained results confirm the effectiveness of using machine learning to recognize fake information, in particular LSTM, which as a result showed an precision of 94.5%. The results of this work can be used for further improvement and development of similar systems.
dc.format.extent	85 с.
dc.identifier.citation	Довгаль, Є. О. Математичне та програмне забезпечення підсистеми виявлення фейкових новин : дипломна робота … бакалавра : 113 Прикладна математика / Довгаль Єва Олександрівна. – Київ, 2023. – 85 с.
dc.identifier.uri	https://ela.kpi.ua/handle/123456789/67079
dc.language.iso	uk
dc.publisher	КПІ ім. Ігоря Сікорського
dc.publisher.place	Київ
dc.subject	фейкова інформація
dc.subject	машинне навчання
dc.subject	логістична регресія
dc.subject	наївний класифікатор Баєса
dc.subject	нейромережі
dc.subject	CNN
dc.subject	RNN
dc.subject	LSTM
dc.subject	векторизація тексту
dc.subject	TF-IDF
dc.subject	Word2Vec
dc.subject	GloVe
dc.title	Математичне та програмне забезпечення підсистеми виявлення фейкових новин
dc.type	Bachelor Thesis

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: Dovhal_bakalavr.pdf
Розмір:: 4.05 MB
Формат:: Adobe Portable Document Format

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 8.98 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Бакалаврські роботи (ПМА)