Математичне та програмне забезпечення підсистеми виявлення фейкових новин
| dc.contributor.advisor | Любашенко, Наталія Дмитрівна | |
| dc.contributor.author | Довгаль, Єва Олександрівна | |
| dc.date.accessioned | 2024-06-11T08:13:15Z | |
| dc.date.available | 2024-06-11T08:13:15Z | |
| dc.date.issued | 2023 | |
| dc.description.abstract | Дипломну роботу виконано на 68 аркушах, вона містить 2 додатки та перелік посилань на використані джерела з 20 найменувань. У роботі наведено 23 рисунків та 3 таблиці. Метою даної дипломної роботи є розробка математичних та програмних засобів для розпізнавання фейкової інформації в текстових даних. У роботі проведено аналіз різних моделей машинного навчання, включаючи логістичну регресію, наївний класифікатор Баєса, нейромережі з використанням згорткових (CNN), рекурентних (RNN) та довготривалих (LSTM) шарів. Також були розглянуті різні методи векторизації тексту, зокрема Bag of Words, TF-IDF, Word2Vec та GloVe. У процесі роботи було порівняно ефективність цих моделей та методів векторизації такими метриками, як accuracy, precision, recall, f1-score. Для кожної моделі були розроблені та налаштовані відповідні алгоритми навчання. Здійснено тестування розроблених систем з використанням реальних наборів даних з відкритих джерел (Kaggle), що містили фейкову та правдиву інформацію. Отримані результати підтверджують ефективність використання машинного навчання для розпізнавання фейкової інформації, зокрема LSTM, який в результаті показав точність 94,5%. Результати цієї роботи можуть бути використані для подальшого вдосконалення та розробки подібних систем. | |
| dc.description.abstractother | The thesis is presented in 68 pages. It contains 2 appendixes and bibliography of 20 references. 23 figures and 3 tables are given in the thesis. The purpose of this thesis is to develop mathematical and software tools for recognizing fake information in textual data. The paper analyzes various machine learning models, including logistic regression, naive Bayes classifier, neural networks using convolutional (CNN), recurrent (RNN) and long short-term memory (LSTM) layers. Various text vectorization methods were also considered, including Bag of Words, TF-IDF, Word2Vec, and GloVe. During the work, the efficiency of these models and vectorization methods was compared using such metrics as accuracy, precision, recall, f1-score. Appropriate learning algorithms were developed and configured for each model. The developed systems were tested using real data sets from open sources (Kaggle), which contained fake and true information. The obtained results confirm the effectiveness of using machine learning to recognize fake information, in particular LSTM, which as a result showed an precision of 94.5%. The results of this work can be used for further improvement and development of similar systems. | |
| dc.format.extent | 85 с. | |
| dc.identifier.citation | Довгаль, Є. О. Математичне та програмне забезпечення підсистеми виявлення фейкових новин : дипломна робота … бакалавра : 113 Прикладна математика / Довгаль Єва Олександрівна. – Київ, 2023. – 85 с. | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/67079 | |
| dc.language.iso | uk | |
| dc.publisher | КПІ ім. Ігоря Сікорського | |
| dc.publisher.place | Київ | |
| dc.subject | фейкова інформація | |
| dc.subject | машинне навчання | |
| dc.subject | логістична регресія | |
| dc.subject | наївний класифікатор Баєса | |
| dc.subject | нейромережі | |
| dc.subject | CNN | |
| dc.subject | RNN | |
| dc.subject | LSTM | |
| dc.subject | векторизація тексту | |
| dc.subject | TF-IDF | |
| dc.subject | Word2Vec | |
| dc.subject | GloVe | |
| dc.title | Математичне та програмне забезпечення підсистеми виявлення фейкових новин | |
| dc.type | Bachelor Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Dovhal_bakalavr.pdf
- Розмір:
- 4.05 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: