Програмний метод аналізу текстів новин на неправдивість
dc.contributor.advisor | Олещенко, Любов Михайлівна | |
dc.contributor.author | Мельничук, Олексій Геннадійович | |
dc.date.accessioned | 2024-08-22T09:14:53Z | |
dc.date.available | 2024-08-22T09:14:53Z | |
dc.date.issued | 2024 | |
dc.description.abstract | З розвитком інформаційних технологій цифровізація новин була лише питанням часу. Завдяки доступності мережі Інтернет та різних соціальних мереж інформація почала поширюватися зі швидкістю, до якої людство не було готовим. З цією швидкістю поширення інформації сьогодні людству стає все складніше визначати правдивість новинних текстів, особливо в соціальних мережах. Виникає потреба у розробленні програмної системи, що зможе автоматизовано аналізувати текст новин за кількома категоріями недостовірності. У магістерській дисертації представлено програмний метод, який включає вдосконалену попередню обробку текстів новин, тренування комбінованих класифікаторів та аналіз оброблених текстів новин за категоріями неправдивості, сатири та мови ворожнечі. Наведено показники точності передбачень, а також порівняння швидкодії навчання та виконання передбачень для запропонованих та базових моделей класифікації. Для програмної реалізації методу було використано мову програмування Python, фреймворк Flask, бібліотеки Scikit-learn, Numpy та NLTK. Згідно з отриманими результатами дослідження, використання програмного забезпечення з запропонованою архітектурою дозволяє в окремих випадках підвищити точність на 4.18% порівняно з класичними методами. | |
dc.description.abstractother | With the development of information technology, the digitization of news was only a matter of time. Thanks to the accessibility of the Internet and social networks, information began to spread at a speed humanity was not prepared for. This speed has made it difficult to maintain neutrality and truthfulness in news texts, especially on social networks. There arises a need for a software system that can automatically analyze news text across several categories of inaccuracy. The master's thesis presents a software method that includes enhanced preprocessing of news texts, training of combined classifiers, and analysis of processed news texts by categories of falsehood, satire, and hate speech. The thesis provides accuracy metrics for the proposed methods and compares the training and prediction performance of software using the proposed algorithms against baseline algorithms. The software implementation of the method was developed using the Python programming language, the Flask framework, and the libraries Scikit-learn, Numpy, and NLTK. According to the research results, the use of software with the proposed architecture allows for an accuracy increase of up to 4.18% in certain cases compared to classical methods. | |
dc.format.extent | 135 с. | |
dc.identifier.citation | Мельничук, О. Г. Програмний метод аналізу текстів новин на неправдивість : магістерська дис. : 121 Інженерія програмного забезпечення / Мельничук Олексій Геннадійович. – Київ, 2024. – 135 с. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/68474 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | програмний метод | |
dc.subject | алгоритми класифікації | |
dc.subject | аналіз текстів на недостовірність | |
dc.subject | tf-idf | |
dc.subject | python | |
dc.subject.udc | 004.912 | |
dc.title | Програмний метод аналізу текстів новин на неправдивість | |
dc.type | Master Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Melnychuk_magistr.pdf
- Розмір:
- 4.4 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: