Системи детектування плагіату в лабораторних роботах
Вантажиться...
Дата
2024
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Дипломна робота: 90 сторінок, 19 рисунків, 2 додаток, 25 джерел.
Об’єкт дослідження – програмний код в лабораторних роботах, який підлягає перевірці на наявність плагіату.
Предмет дослідження – алгоритми та технології виявлення плагіату у програмному коді.
Мета роботи – розробка системи автоматизованого виявлення плагіату в програмному коді лабораторних робіт, що використовує алгоритм спектральної кластеризації для виявлення схожості між роботами.
Було вивчено існуючі методи та алгоритми виявлення плагіату у програмному коді. Проведено токенізацію. Використано метод TF-IDF для перетворення текстових даних у векторне представлення. Застосовано спектральну кластеризацію для групування схожих робіт. Використано метрику косинусної подібності для оцінки плагіату між роботами, що знаходяться в одному кластері.
Опис
Ключові слова
плагіат програмного коду, кластеризація, спектральна кластеризація, векторизація, tf-idf, косинусна подібність, токенізація, software code plagiarisation, clusterization, spectral clusterization, vectorization, cosine similarity, tokenization
Бібліографічний опис
Петренко, Д. С. Системи детектування плагіату в лабораторних роботах : дипломна робота ... бакалавра : 124 Системний аналіз / Петренко Дмитро Сергійович. - Київ, 2024. - 90 с.