Математичне та програмне забезпечення виявлення елементів дезінформації в потоках текстових даних
dc.contributor.advisor | Олійник, Юрій Олександрович | |
dc.contributor.author | Ошийко, Ярослав Романович | |
dc.date.accessioned | 2021-03-01T12:24:58Z | |
dc.date.available | 2021-03-01T12:24:58Z | |
dc.date.issued | 2020-05 | |
dc.description.abstracten | Relevance: With the spread of the Internet and social media, a number of news, articles and other text are now available online. This vast amount of information has jeopardized the veracity of the news being spread. Fake news is any form of false information or content that is distributed on the Internet to influence people's views on a particular event or information. Detecting fake news in the digital world is an important task in overcoming rumors and prejudices. Many studies have been conducted to identify elements of misinformation for English, but Ukrainian and Russian have no research in this area. Companies such as Facebook, Twitter and Google are facing the challenge of providing this platform to provide people with trust in the content of the news feed. The influence of fake news was so deeply ingrained in society that it even affected the 2016 US election. Also, a lot of false information is spread during the war in Ukraine in the anti-terrorist operation zone, which leads to destabilization of the population, the spread of misconceptions, the reflection of a fake picture of events. Therefore, a necessary task is to create a tool to check textual information for the presence of elements of misinformation for information security and analysis of news that are disseminated to destabilize and deceive the population. Purpose: facilitate the detection of elements of misinformation by creating a method and algorithm to check the flow of text data for the presence of elements of misinformation in the form of linguistic constructions and turns that indicate the falsity of the information provided. To achieve this goal, the following tasks were formulated: - perform an analysis of existing algorithms and methods of computer linguistics and machine learning to classify text data streams and identify elements of misinformation; - to develop an algorithm for primary text processing to increase the accuracy of determining the elements of misinformation; - to develop a method of detecting elements of misinformation in text data streams; - perform software implementation of the developed method of detecting elements of misinformation in text data streams; - analyze the results obtained to assess quality; - to study the effectiveness of the algorithm. Object of study: methods of detecting elements of misinformation in text data streams. Research methods: computer linguistics and machine learning methods to identify elements of misinformation. Scientific novelty: scientific novelty is that the research conducted in the scientific work has the support of the Ukrainian and Russian languages. Publications: The main provisions of the work were reported and discussed at the IV All-Ukrainian Scientific and Practical Conference of Young Scientists and Students "Information Systems and Management Technologies" (ISTU-2020), as well as at the XVI International Scientific Conference "Intellectual Systems of Decision-making and Problem of Computational Intelligence" (ISDMCI'2020 ) »The results of the master's dissertation were presented at scientific conferences. | uk |
dc.description.abstractuk | Актуальність. З розповсюдженням Інтернету та соціальних медіа зараз доступна кількість новин, статей та іншого тексту онлайн. Цей величезний обсяг інформації постав під загрозу правдивість новин, які поширюються. Підроблені новини - це будь-яка форма помилкової інформації чи контенту, що поширюється в мережі Інтернет, для впливу на погляд людей на певну подію чи інформацію. Виявлення фальшивих новин у цифровому світі є важливим завданням у подоланні широкого розповсюдження чуток та упереджень. Багато досліджень було проведено для виявлення елементів дезінформації для англійської мови, проте українська та російська мови не має досліджень у цій галузі. Такі компанії, як Facebook, Twitter та Google, стикаються з проблемою вирішення цієї проблеми, щоб забезпечити платформу, де люди можна довіряти вмісту стрічки новин. Вплив фейкових новин було таким глибоко вкорінене в суспільстві, що це навіть вплинуло на вибори в США 2016 року. Також багато неправдивої інформації поширюється протягом війни України в зоні АТО, що призводить до дестабілізації населення, поширення неправильних думок, відображення фейкової картини перебігу подій. Отже, необхідною задачею є створення інструменту перевірки текстової інформації на наявність елементів дезінформації для інформаційної безпеки та аналізу новин, які поширюються для дестабілізації та обману населення. Метою дослідження є полегшення виявлення елементів дезінформації за рахунок створення методу та алгоритму для перевірки потоку текстових даних на наявність елементів дезінформації у вигляді лінгвістичних конструкцій та оборотів, які вказують на неправдивість представленої інформації. Для досягнення поставленої мети необхідно виконати наступні завдання: - виконати аналіз існуючих алгоритмів та методів комп'ютерної лінгвістики та машинного навчання для класифікації текстових потоків даних та виявлення елементів дезінформації; - розробити алгоритм первинної обробки тексту для збільшення точності визначення елементів дезінформації; - розробити метод виявлення елементів дезінформації в текстових потоках даних; - виконати програмну реалізацію розробленого методу виявлення елементів дезінформації в текстових потоках даних; - провести аналіз отриманих результатів для оцінки якості; - провести дослідження ефективності алгоритму. Предметом дослідження є методи виявлення елементів дезінформації в текстових потоках даних. Методами дослідження є методи комп’ютерної лінгвістики та машинного навчання для виявлення елементів дезінформації. Наукова новизна отриманих результатів: науковою новизною є розробка методу виявлення елементів дезінформації в потоках даних з підтримкою обробки текстів української та російської мови. Публікації: основні положення роботи доповідались і обговорювались на IV всеукраїнській науково-практичній конференції молодих вчених та студентів «Інформаційні системи та технології управління» (ІСТУ-2020), а також подано до друку на ХVІ міжнародній науковій конференції «Інтелектуальні системи прийняття рішень та проблеми обчислювального інтелекту (ISDMCI’2020)» результати магістерської дисертації докладались на наукових конференціях. | uk |
dc.format.page | 94 с. | uk |
dc.identifier.citation | Ошийко, Я. Р. Математичне та програмне забезпечення виявлення елементів дезінформації в потоках текстових даних : магістерська дис. : 121 Інженерія програмного забезпечення / Ошийко Ярослав Романович. – Київ, 2020. – 94 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/39711 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | машинне навчання | uk |
dc.subject | класифікація | uk |
dc.subject | дезінформація | uk |
dc.subject | потоки текстових даних | uk |
dc.subject | machine learning | uk |
dc.subject | classification | uk |
dc.subject | disinformation | uk |
dc.subject | text data flows | uk |
dc.subject.udc | 004 | uk |
dc.title | Математичне та програмне забезпечення виявлення елементів дезінформації в потоках текстових даних | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Oshyiko_magistr.pdf
- Розмір:
- 2.89 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: