Інформаційна система з пошуку плагіату в текстах
dc.contributor.advisor | Гавриленко, Олена Валеріївна | |
dc.contributor.author | Бистріцький, Артем Ігорович | |
dc.date.accessioned | 2025-03-12T09:06:50Z | |
dc.date.available | 2025-03-12T09:06:50Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Новизна полягає у створенні власної системи перевірки текстів на плагіат, яка поєднує функції самостійного вибору та кастомізації алгоритмів перевірки, автоматичного перекладу текстів для аналізу багатомовних документів та пошуку співпадінь у мережі Інтернет. Мета дослідження. Аналіз і відбір алгоритмів для пошуку плагіату та побудова власної інформаційної системи для визначення співпадінь між текстами. Об’єкт дослідження. Співпадіння в текстових документах. Предмет дослідження. Інформаційна система з пошуку плагіату в текстах. Для реалізації мети поставлено наступні завдання: проаналізувати існуючі алгоритми, виявити їхні переваги та недоліки; модифікувати алоритм шинглів, за рахунок надання можливості обирати довжину шинглів; розробити алгоритм перевірки за допомогою коефіцієнту схожості Жаккара; модифікувати алгоритм перевірки за допомогою методу опорних векторів; розробити алгоритм перекладання текстів з різних мов на українську; розробити можливість пошуку співпадінь в мережі Інтернет; розробити користувацький інтерфейс. | |
dc.description.abstractother | The explanatory note of the diploma project consists of five sections, contains 27 tables, 9 applications and 109 sources - a total of 109 pages. The object of study: matches in text documents. The aim of the diploma project: to analyze and select algorithms for plagiarism detection and to build our own information system for determining matches between texts. In the first section, a description of the subject area was presented, where classifications of plagiarism types were reviewed, as well as an analysis of existing solutions in the market, their advantages and disadvantages, and a comparative characterization was made. In the second section, an overview of plagiarism detection algorithms was provided, specifically focusing on lexical and statistical analysis, as well as machine learning. The third section presented a description of the mathematical foundation, where three key methods for plagiarism detection were discussed: the shingles algorithm, the Jaccard coefficient similarity algorithm, and the Support Vector Machine (SVM) algorithm. Also covered was a hybrid translation- based algorithm and an algorithm for detecting matches on the Internet. The fourth section described the structural diagram of the system and the development of software for plagiarism detection. The fifth section was dedicated to the idea of the market introduction of a startup project, where a competitor analysis was conducted, and the accessibility of technologies was assessed. | |
dc.format.extent | 109 с. | |
dc.identifier.citation | Бистріцький, А. І. Інформаційна система з пошуку плагіату в текстах : магістерська дис. : 126 Інформаційні системи та технології / Бистріцький Артем Ігорович. – Київ, 2024. – 109 с. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/72865 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | шингли | |
dc.subject | жаккар | |
dc.subject | svm | |
dc.subject | плагіат | |
dc.subject | переклад | |
dc.subject | пошук в інтернеті | |
dc.subject | кастомізація | |
dc.subject | алгоритми | |
dc.subject | україномовна система | |
dc.subject.udc | 004.9 | |
dc.title | Інформаційна система з пошуку плагіату в текстах | |
dc.type | Master Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Bystritsky_magistr.pdf
- Розмір:
- 3.16 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: