Виявлення плагіату програмного коду в студентських роботах

Вантажиться...
Ескіз

Дата

2022-06

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Актуальність. З розвитком інформаційних технологій та мережі Інтернет проблема порушення принципів академічної доброчесності набула досить великих масштабів, окрім того, ситуація значно погіршилась з вимушеним переходом на дистанційне навчання. Ситуацію додатково погіршує ще й те, що різні медіа ресурси пропонують послуги рерайтингу, копірайтингу та ін. Через це студенти можуть і не до кінця усвідомлювати поняття плагіату та не розуміти, що вони займаються академічним шахрайством. Згідно зі статистики на 2020 рік, кількість плагіату в роботах студентів, що навчаються в університетах за напрямком «Комп’ютерні науки», складала до 80%[32]. Ці статистичні дані, безсумнівно, підкреслюють що проблема академічної недоброчесності на сьогодні є дуже серйозною та роботи студентів необхідно перевіряти більш ретельно з використанням ефективних методів для перевірки на плагіат. Мета і задачі дослідження. Метою даного дослідження є розробка ефективного методу перевірки програмного коду на плагіат. Основними завданнями даної роботи є дослідження існуючих статей, публікацій та робіт на тему виявлення плагіату програмного коду, практична перевірка та проведення порівняльного аналізу існуючих рішень з метою подальшого проектування та реалізації більш ефективного та стійкого до вразливостей методу перевірки програмного коду на наявність запозичень. Об’єкт дослідження. Технології та алгоритми, які використовуються для вирішення задачі виявлення випадків плагіату в сирцевому програмному коді. Предмет дослідження. Підходи та алгоритми, що дозволяють розробити ефективну систему для перевірки студентських робіт на плагіат, яка буде захищена від такої вразливості як порушення хешування. Наукова новизна отриманих результатів. Полягає в розробці ефективного алгоритму перевірки програмного коду на плагіат з використанням дерев абстрактного синтаксису та нейронних мереж, що у комбінації надаватиме менше можливостей для атаки колізією хешування. Практичне значення отриманих результатів. Імплементація розробленого алгоритму може бути використана у вищих навчальних закладах з метою перевірки завдань з програмування на наявність запозичень, що дозволить більш ефективно перевіряти роботи, економити час викладача на перевірку, отримати реальний зріз знань студентів та в перспективі підвищити залишковий рівень знань студента з певних дисциплін. Загальний обсяг роботи – 99 сторінок, 42 рисунки, 24 таблиці, 35 посилань.

Опис

Ключові слова

PLP, transformers, MOSS, Mossad, виявлення плагіату програмного коду, AST, Code2Vec, TreeBERT, transformers, source code plagiarism detection

Бібліографічний опис

Мироненко, Є. А. Виявлення плагіату програмного коду в студентських роботах : магістерська дис. : 122 Комп'ютерні науки / Мироненко Єлизавета Андріївна. - Київ, 2022. - 99 с.

ORCID

DOI