Системи детектування плагіату в лабораторних роботах
dc.contributor.advisor | Канцедал, Георгій Олегович | |
dc.contributor.author | Петренко, Дмитро Сергійович | |
dc.date.accessioned | 2024-11-06T10:24:28Z | |
dc.date.available | 2024-11-06T10:24:28Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Дипломна робота: 90 сторінок, 19 рисунків, 2 додаток, 25 джерел. Об’єкт дослідження – програмний код в лабораторних роботах, який підлягає перевірці на наявність плагіату. Предмет дослідження – алгоритми та технології виявлення плагіату у програмному коді. Мета роботи – розробка системи автоматизованого виявлення плагіату в програмному коді лабораторних робіт, що використовує алгоритм спектральної кластеризації для виявлення схожості між роботами. Було вивчено існуючі методи та алгоритми виявлення плагіату у програмному коді. Проведено токенізацію. Використано метод TF-IDF для перетворення текстових даних у векторне представлення. Застосовано спектральну кластеризацію для групування схожих робіт. Використано метрику косинусної подібності для оцінки плагіату між роботами, що знаходяться в одному кластері. | |
dc.description.abstractother | Thesis work: 90 pages, 19 figures, 2 appendices, 25 references. Object of research – software code in laboratory works, which is subject to a check for plagiarism. Research subject – algorithms and technologies for detecting plagiarism in software code. The purpose of the work – development of a system for automated detection of plagiarism in the software code of laboratory works? Which uses the spectral clustering algorithm to detect similarities between works. Existing methods and algorithms for detecting plagiarism in software code were studied. Tokenization has been carries out. The TF-IDF method was used to convert text data into a vector representation. Spectral clustering was used to group similar works. The cosine similarity metric was used to assess plagiarism between works in the same cluster. | |
dc.format.extent | 90 с. | |
dc.identifier.citation | Петренко, Д. С. Системи детектування плагіату в лабораторних роботах : дипломна робота ... бакалавра : 124 Системний аналіз / Петренко Дмитро Сергійович. - Київ, 2024. - 90 с. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/70362 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | плагіат програмного коду | |
dc.subject | кластеризація | |
dc.subject | спектральна кластеризація | |
dc.subject | векторизація | |
dc.subject | tf-idf | |
dc.subject | косинусна подібність | |
dc.subject | токенізація | |
dc.subject | software code plagiarisation | |
dc.subject | clusterization | |
dc.subject | spectral clusterization | |
dc.subject | vectorization | |
dc.subject | cosine similarity | |
dc.subject | tokenization | |
dc.title | Системи детектування плагіату в лабораторних роботах | |
dc.type | Bachelor Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Petrenko_bakalavr.pdf
- Розмір:
- 1.47 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: