Система аналізу збіжності текстової інформації для оцінки плагіату

dc.contributor.advisorКузьміних, Валерій Олександрович
dc.contributor.authorПивовар, Назарій Олександрович
dc.date.accessioned2020-02-29T11:54:17Z
dc.date.available2020-02-29T11:54:17Z
dc.date.issued2019-12
dc.description.abstractСтруктура й обсяг дипломної роботи. Магістерська дисертація складається зі вступу, 6 розділів, висновку, переліку посилань з 28 найменувань, 1 додатку, і містить 39 рисунків, 16 таблиці. Повний обсяг магістерської дисертації складає 95 сторінок, з яких перелік посилань займає 2 сторінки, додатки – 4 сторінки. Актуальність теми. Розвиток та розповсюдження засобів комунікації і доступу до мережі Інтернет сприяє збільшенню спектру інформації до якої людина має доступ. За допомогою звичайного смартфону можна здійснити пошук будь-якої інформації. Тим не менш, звідси виникає нова проблема: так як кожен може отримати доступ до будь-якої інформації, значно складніше оцінити чи є вона оригіналом чи взята з інших відкритих джерел. Досить часто у мережі Інтернет можна знайти джерела інформації (будь то статті, сайти, онлайн журнали і т.п.), які майже повністю складаються с фрагментів тексту інших джерел. Сьогодні існують такі програми як Advego Plagiatius, Etxt Antiplagiat та онлайн сервіси як UNPLAG, Content-Watch та інші. Проте мало які системи дають точні результати і рекомендується перевіряти результати у декількох системах. Так як для людини це досить не проста задача було прийнято рішення розробки системи аналізу збіжності текстової інформації для оцінки плагіату. Мета дослідження полягає у створенні системи аналізу збіжності текстової інформації для оцінки плагіату. Завдання дослідження. Для досягнення поставленої задачі були поставлені наступні завдання: – провести аналіз існуючих рішень; – обрати бібліотеку для обробки текстової інформації і пошуку подібності; – провести аналіз бібліотеки sklearn, яка містить утиліти для використання в обчисленні подібності текстів; – провести аналізу веб-фреймворку Flask та бібліотеки React для побудови додатку за клієнт-серверною архітектурою; – програмно реалізувати модифікацію векторного алгоритму за допомогою триграм. Об’єктом дослідження аналіз збіжності текстової інформації. Предметом дослідження системи аналізу збіжності текстової інформації для оцінки плагіату. Наукова новизна одержаних результатів. Наукова новизна полягає у модифікуванні векторного методу аналізу з використанням триграм. Практичне значення. Система аналізу збіжності текстової інформації дозволяють перевірити життєздатність розробленого алгоритму.uk
dc.description.abstractenStructure and volume of the thesis.The master's dissertationconsists of an introduction, 6 sections, conclusion, a list of links of 28 titles, 1 annex, and contains 39 pictures, 16 tables. The full volume of the master's thesis is 95 pages, of which the list of links occupies 3 pages, the applications -4 pages. Actuality of theme. The development and dissemination of communications and Internet access enhances the range of information that a person has access to. You can search for any information with your regular smartphone. However, this raises a new problem: since anyone can access any information, it is much more difficult to evaluate whether it is original or taken from other open sources. Quite often on the Internet you can find sources of information (be it articles, websites, online journals, etc.) that are almost entirely composed of snippets of text from other sources. Today there are programs such as Advego Plagiatius, Etxt Antiplagiat and online services such as UNPLAG, Content-Watch and more. However, few systems produce accurate results, and it is recommended that multiple systems test results. Since it is not a simple task for a person, the decision was made to develop a system of analysis of convergence of textual information for the evaluation of plagiarism. The purpose of the study is to create text similarity analysis system for plagiarism assessment. Objectives of the study. To achieve this task, the following tasks were set: – analyze existing solutions; – select a library for processing textual information and finding similarities; – analyze the sklearn library, which contains utilities for calculating text similarities; – analyze the Flask web framework and React library to build a client-server architecture application;–programmatically implement the modification of the vector algorithm with the help of trigrams. The object of the study is to analyze the text similarity methods. The subject of the study are text similarity analysis systems. Scientific novelty of the obtained results. The scientific novelty is to modify the vector method of analysis using trigrams. Practical meaning. The system of analysis of convergence of textual information allow to check the viability of the developed algorithm.uk
dc.format.page104 с.uk
dc.identifier.citationПивовар, Н. О. Система аналізу збіжності текстової інформації для оцінки плагіату : магістерська дис. : 121 Інженерія програмного забезпечення / Пивовар Назарій Олександрович. – Київ, 2019. – 104 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/32020
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectзбіжність текстової інформаціїuk
dc.subjectвекторний методuk
dc.subjectплагіатuk
dc.subjecttext similarityuk
dc.subjectvector similarity methoduk
dc.subjectplagiarismuk
dc.titleСистема аналізу збіжності текстової інформації для оцінки плагіатуuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Pyvovar_magistr.pdf
Розмір:
6.01 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.06 KB
Формат:
Item-specific license agreed upon to submission
Опис: