Спосіб розпізнавання фейкових новин у мережі Інтернет

dc.contributor.advisorСімоненко, Валерій Павлович
dc.contributor.authorМіщенко, Людмила Дмитрівна
dc.date.accessioned2020-06-09T11:36:32Z
dc.date.available2020-06-09T11:36:32Z
dc.date.issued2020
dc.description.abstractenThe work consists of an introduction and four sections. Total workload: 79 pages of main text, 15 illustrations, 10 tables. In preparation, literature from 23 different sources was used. Topicality. The use of various news web resources on the Internet and social networks to spread information is becoming increasingly popular. By recruiting and trusting some readers, such sources begin to spread fake news or manipulation. Therefore, the idea of protecting the population from misinformation and spreading manipulative influence in times of war is extremely urgent and necessary today. The use of modern technologies is a necessary factor in the fight against the spread of fake data. Moreover, the main task is the rapid automatic analysis of information, as well as the dissemination of denials and true facts. Therefore, developing new algorithms for searching and analyzing the news flow is an urgent task. The purpose and objectives of the study. The aim of the master's thesis is to increase the efficiency of the system for the detection, synthesis and analysis of news through the use of technology Natural Language Processing. To achieve the goal of the study set and solved the following tasks: ● research on the structure of the most popular news web resources with fake news; ● collecting and structuring truthful information and simplified facts; ● development of software for the collection and synthesis of information; ● development of text analysis software; ● illustration of the program and analysis of the results. The object of study is the process of detecting and analyzing fake news. The subject of the study - methods to create algorithm for fake news synthesis and analysis. Research Methods. To achieve the goals set in the master's work, the methods of graph theory, natural language processing techniques were used. The scientific novelty of the results obtained is as follows:  a method of analyzing and verifying the truth of information on the Internet and social networks is proposed;  combines Natural Language Processing technology, Levenstein distance, and the TF-IDF semantic similarity factor in the developed software to capture, synthesize, and analyze fake news. The research made it possible to use the developed software to classify news into truth, manipulation or fake and to apply it on the social network Facebook or as an extension in the Google Chrome browser. Personal contribution of the applicant. The master's research is a selfcompleted work that reflects the author's personal approach and personally obtained theoretical and applied results related to solving the problem of text analysis using Natural Language Processing technology. The purpose and objectives of the study were formulated jointly with the scientific supervisor. Practical value. The results obtained can be used in future research in the following areas: ● improving the methods of text analysis of a given format; ● fact-checking with automated information technology. Posts: Mishchenko LD Method for Detecting Fake News on the Internet. Science, Society, Education: Topical Issues and Development Prospects: In International Scientific and Practical Conference Kharkiv, Ukraine. 12-14 April 2020 Liudmyla Mishchenko, Valerii Simonenko. METHOD FOR DETECTING FAKE NEWS BASED ON NATURAL LANGUAGE PROCESSING. Міжнародна науково-технічна конференція “The International Conference on Security, Fault Tolerance, Intelligence” (ICSFTI2020 Online).uk
dc.description.abstractukРобота складається із вступу та чотирьох розділів. Загальний обсяг роботи: 79 аркушів основного тексту, 15 ілюстрацій, 10 таблиць. При підготовці використовувалася література з 23 різних джерел. Актуальність. Дедалі більшу популярність набуває використання різних новинних веб ресурсів у мережі Інтернет та соціальних мережах для поширення інформації. Набираючи деяку аудиторію читачів та користуючись їх довірою, такі джерела починають розповсюджувати фейкові новини чи маніпуляції. Тому ідея захисту населення від дезінформації та поширення маніпулятивного впливу в умовах війни є вкрай гострою й необхідною в сьогоденні. Використання сучасних технологій є необхідним фактором у боротьбі із поширенням фейкових даних. При чому, основна задача полягає в швидкому автоматичному аналізі інформації, а також розповсюдженні спростувань та правдивих фактів. Тому розробка нових алгоритмів пошуку та аналізу потоку новин являється вкрай актуальною задачею. Мета і завдання дослідження. Метою магістерської роботи є підвищення ефективності системи для виявлення, синтезу та аналізу новин шляхом застосування технології Natural Language Processing. Для досягнення мети дослідження поставлено і вирішено такі завдання: ● дослідження структури найпопулярніших новинних веб ресурсів із фейковими новинами; ● збір та структуризація правдивої інформації та спростованих фактів; ● розробка програмного забезпечення для збору та синтезу інформації; ● розробка програмного забезпечення для аналізу текстів; ● ілюстрація роботи програми та аналіз отриманих результатів. Об’єкт дослідження – процес пошуку та аналізу фейкових новин. Предмет дослідження – способи створення алгоритмів синтезу та аналізу фейкових новин. Методи досліджень. Для досягнення поставлених в магістерській роботі задач, використано методи теорії графів, методи технології Natural Language Processing. Наукова новизна одержаних результатів роботи полягає у наступному: ● запропоновано спосіб аналізу та перевірки на правдивість інформації в мережі Інтернет та соціальних мережах; ● поєднано технологію Natural Language Processing, відстань Левенштейна та коефіцієнт семантичної схожості слів TF-IDF у розробленому програмному продукті для збору, синтезу та аналізу новин на фейковість. Проведене дослідження дає можливість використання розробленого програмного забезпечення для класифікації новини на правду, маніпуляцію чи фейк та застосування його в соціальній мережі Facebook чи як розширення у браузері Google Chrome. Особистий внесок здобувача. Магістерське дослідження є самостійно виконаною роботою, в якій відображено особистий авторський підхід та особисто отримані теоретичні та прикладні результати, що відносяться до вирішення задачі аналізу текстів за допомогою технології Natural Language Processing. Формулювання мети та завдань дослідження проводилось спільно з науковим керівником. Практична цінність. Отримані результати можуть використовуватися у майбутніх дослідженнях за напрямками: ● вдосконалення методів аналізу текстів заданого формату; ● фактчекінг із автоматизованими інформаційними технологіями. Публікації: Міщенко Л. Д. СПОСІБ РОЗПІЗНАВАННЯ ФЕЙКОВИХ НОВИН. Science, society, education: topical issues and development prospects: V International Scientific and Practical Conference Kharkiv, Ukraine. 12-14 April 2020 Liudmyla Mishchenko, Valerii Simonenko. METHOD FOR DETECTING FAKE NEWS BASED ON NATURAL LANGUAGE PROCESSING. Міжнародна науково-технічна конференція “The International Conference on Security, Fault Tolerance, Intelligence” (ICSFTI2020 Online).uk
dc.format.page89 c.uk
dc.identifier.citationМіщенко, Л. Д. Спосіб розпізнавання фейкових новин у мережі Інтернет : магістерська дис. : 123 Комп’ютерна інженерія / Міщенко Людмила Дмитрівна. – Київ, 2020. – 89 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/34054
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectтехнологія Natural Language Processinguk
dc.subjectфейкuk
dc.subjectманіпуляціяuk
dc.subjectаналіз текстуuk
dc.subjectвідстань Левенштейнаuk
dc.subjectкоефіцієнт семантичної схожості слів та словосполучень TF-IDFuk
dc.subjectnatural language processing technologyuk
dc.subjectfakeuk
dc.subjectmanipulationuk
dc.subjecttext analysisuk
dc.subjectLevenstein distancuk
dc.subjectTF-IDF semantic similarity of words and phrasesuk
dc.subject.udc004uk
dc.titleСпосіб розпізнавання фейкових новин у мережі Інтернетuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Mischenko_magistr.pdf
Розмір:
2.01 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.06 KB
Формат:
Item-specific license agreed upon to submission
Опис: