Інформаційна система з пошуку плагіату в текстах

dc.contributor.advisorГавриленко, Олена Валеріївна
dc.contributor.authorБистріцький, Артем Ігорович
dc.date.accessioned2025-03-12T09:06:50Z
dc.date.available2025-03-12T09:06:50Z
dc.date.issued2024
dc.description.abstractНовизна полягає у створенні власної системи перевірки текстів на плагіат, яка поєднує функції самостійного вибору та кастомізації алгоритмів перевірки, автоматичного перекладу текстів для аналізу багатомовних документів та пошуку співпадінь у мережі Інтернет. Мета дослідження. Аналіз і відбір алгоритмів для пошуку плагіату та побудова власної інформаційної системи для визначення співпадінь між текстами. Об’єкт дослідження. Співпадіння в текстових документах. Предмет дослідження. Інформаційна система з пошуку плагіату в текстах. Для реалізації мети поставлено наступні завдання: проаналізувати існуючі алгоритми, виявити їхні переваги та недоліки; модифікувати алоритм шинглів, за рахунок надання можливості обирати довжину шинглів; розробити алгоритм перевірки за допомогою коефіцієнту схожості Жаккара; модифікувати алгоритм перевірки за допомогою методу опорних векторів; розробити алгоритм перекладання текстів з різних мов на українську; розробити можливість пошуку співпадінь в мережі Інтернет; розробити користувацький інтерфейс.
dc.description.abstractotherThe explanatory note of the diploma project consists of five sections, contains 27 tables, 9 applications and 109 sources - a total of 109 pages. The object of study: matches in text documents. The aim of the diploma project: to analyze and select algorithms for plagiarism detection and to build our own information system for determining matches between texts. In the first section, a description of the subject area was presented, where classifications of plagiarism types were reviewed, as well as an analysis of existing solutions in the market, their advantages and disadvantages, and a comparative characterization was made. In the second section, an overview of plagiarism detection algorithms was provided, specifically focusing on lexical and statistical analysis, as well as machine learning. The third section presented a description of the mathematical foundation, where three key methods for plagiarism detection were discussed: the shingles algorithm, the Jaccard coefficient similarity algorithm, and the Support Vector Machine (SVM) algorithm. Also covered was a hybrid translation- based algorithm and an algorithm for detecting matches on the Internet. The fourth section described the structural diagram of the system and the development of software for plagiarism detection. The fifth section was dedicated to the idea of the market introduction of a startup project, where a competitor analysis was conducted, and the accessibility of technologies was assessed.
dc.format.extent109 с.
dc.identifier.citationБистріцький, А. І. Інформаційна система з пошуку плагіату в текстах : магістерська дис. : 126 Інформаційні системи та технології / Бистріцький Артем Ігорович. – Київ, 2024. – 109 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/72865
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectшингли
dc.subjectжаккар
dc.subjectsvm
dc.subjectплагіат
dc.subjectпереклад
dc.subjectпошук в інтернеті
dc.subjectкастомізація
dc.subjectалгоритми
dc.subjectукраїномовна система
dc.subject.udc004.9
dc.titleІнформаційна система з пошуку плагіату в текстах
dc.typeMaster Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Bystritsky_magistr.pdf
Розмір:
3.16 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: