Система аналізу збіжності текстової інформації для оцінки плагіату
Вантажиться...
Дата
2019-12
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Структура й обсяг дипломної роботи. Магістерська дисертація складається зі вступу, 6 розділів, висновку, переліку посилань з 28 найменувань, 1 додатку, і містить 39 рисунків, 16 таблиці. Повний обсяг магістерської дисертації складає 95 сторінок, з яких перелік посилань займає 2 сторінки, додатки – 4 сторінки.
Актуальність теми. Розвиток та розповсюдження засобів комунікації і доступу до мережі Інтернет сприяє збільшенню спектру інформації до якої людина має доступ. За допомогою звичайного смартфону можна здійснити пошук будь-якої інформації. Тим не менш, звідси виникає нова проблема: так як кожен може отримати доступ до будь-якої інформації, значно складніше оцінити чи є вона оригіналом чи взята з інших відкритих джерел. Досить часто у мережі Інтернет можна знайти джерела інформації (будь то статті, сайти, онлайн журнали і т.п.), які майже повністю складаються с фрагментів тексту інших джерел. Сьогодні існують такі програми як Advego Plagiatius, Etxt Antiplagiat та онлайн сервіси як UNPLAG, Content-Watch та інші. Проте мало які системи дають точні результати і рекомендується перевіряти результати у декількох системах. Так як для людини це досить не проста задача було прийнято рішення розробки системи аналізу збіжності текстової інформації для оцінки плагіату.
Мета дослідження полягає у створенні системи аналізу збіжності текстової інформації для оцінки плагіату.
Завдання дослідження. Для досягнення поставленої задачі були поставлені наступні завдання:
– провести аналіз існуючих рішень;
– обрати бібліотеку для обробки текстової інформації і пошуку подібності;
– провести аналіз бібліотеки sklearn, яка містить утиліти для використання в обчисленні подібності текстів;
– провести аналізу веб-фреймворку Flask та бібліотеки React для побудови додатку за клієнт-серверною архітектурою;
– програмно реалізувати модифікацію векторного алгоритму за допомогою триграм.
Об’єктом дослідження аналіз збіжності текстової інформації.
Предметом дослідження системи аналізу збіжності текстової інформації для оцінки плагіату.
Наукова новизна одержаних результатів. Наукова новизна полягає у модифікуванні векторного методу аналізу з використанням триграм.
Практичне значення. Система аналізу збіжності текстової інформації дозволяють перевірити життєздатність розробленого алгоритму.
Опис
Ключові слова
збіжність текстової інформації, векторний метод, плагіат, text similarity, vector similarity method, plagiarism
Бібліографічний опис
Пивовар, Н. О. Система аналізу збіжності текстової інформації для оцінки плагіату : магістерська дис. : 121 Інженерія програмного забезпечення / Пивовар Назарій Олександрович. – Київ, 2019. – 104 с.