Системи детектування плагіату в лабораторних роботах

Вантажиться...
Ескіз

Дата

2024

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Дипломна робота: 90 сторінок, 19 рисунків, 2 додаток, 25 джерел. Об’єкт дослідження – програмний код в лабораторних роботах, який підлягає перевірці на наявність плагіату. Предмет дослідження – алгоритми та технології виявлення плагіату у програмному коді. Мета роботи – розробка системи автоматизованого виявлення плагіату в програмному коді лабораторних робіт, що використовує алгоритм спектральної кластеризації для виявлення схожості між роботами. Було вивчено існуючі методи та алгоритми виявлення плагіату у програмному коді. Проведено токенізацію. Використано метод TF-IDF для перетворення текстових даних у векторне представлення. Застосовано спектральну кластеризацію для групування схожих робіт. Використано метрику косинусної подібності для оцінки плагіату між роботами, що знаходяться в одному кластері.

Опис

Ключові слова

плагіат програмного коду, кластеризація, спектральна кластеризація, векторизація, tf-idf, косинусна подібність, токенізація, software code plagiarisation, clusterization, spectral clusterization, vectorization, cosine similarity, tokenization

Бібліографічний опис

Петренко, Д. С. Системи детектування плагіату в лабораторних роботах : дипломна робота ... бакалавра : 124 Системний аналіз / Петренко Дмитро Сергійович. - Київ, 2024. - 90 с.

ORCID

DOI