Виявлення плагіату програмного коду в студентських роботах

dc.contributor.advisorКисельов, Геннадій Дмитрович
dc.contributor.authorМироненко, Єлизавета Андріївна
dc.date.accessioned2023-02-09T10:08:01Z
dc.date.available2023-02-09T10:08:01Z
dc.date.issued2022-06
dc.description.abstractenRelevance of the topic theme. With constant development of information technology and the Internet, the problem of violating the principles of academic integrity has become rather serious. In addition, the situation has significantly deteriorated with the forced transition to distance learning. The situation is further aggravated by the fact that various media resources offer rewriting, copywriting and other services. As a result, students may not be fully aware of the concept of plagiarism and may not understand that they their actions are nothing else than an academic fraud. According to statistics for 2020, the amount of plagiarism in the work of students that are studying at universities in the "Computer Science" field was almost 80%[32]. These statistics undoubtedly emphasize that the problem of academic dishonesty is very serious today and that students' work needs to be inspected more effectively using effective plagiarism testing methods. The purpose and objectives of the work. The aim of this study is to develop an effective method for checking software code for plagiarism. The main objectives of this work are: studying of existing articles, publications, works related to the detection of plagiarism in software code, practical testing and comparative analysis of existing solutions in order to design and implement a more efficient and stable method for source code plagiarism detection. Object of study. Technologies and algorithms used to solve the problem of detecting cases of plagiarism in program code. Subject of study. Approaches and algorithms that allow to develop an effective system for testing student work for plagiarism, which will be protected from such vulnerability as hashing violation. Scientific novelty of the obtained results is to develop an effective source code plagiarism detection algorithm, which is protected from hashing violation problem, using abstract syntax trees and neural networks. The practical significance of the obtained results. The implementation of the developed algorithm can be used in universities to check programming assignments for plagiarism, which will help to inspect students’ works more effectively, save teacher’s time that is usually spent on work checks, get a real understanding about students' knowledge and increase the residual level of student knowledge in certain disciplines. The total volume of work is 99 pages, 42 pictures, 24 tables, 35 links.uk
dc.description.abstractukАктуальність. З розвитком інформаційних технологій та мережі Інтернет проблема порушення принципів академічної доброчесності набула досить великих масштабів, окрім того, ситуація значно погіршилась з вимушеним переходом на дистанційне навчання. Ситуацію додатково погіршує ще й те, що різні медіа ресурси пропонують послуги рерайтингу, копірайтингу та ін. Через це студенти можуть і не до кінця усвідомлювати поняття плагіату та не розуміти, що вони займаються академічним шахрайством. Згідно зі статистики на 2020 рік, кількість плагіату в роботах студентів, що навчаються в університетах за напрямком «Комп’ютерні науки», складала до 80%[32]. Ці статистичні дані, безсумнівно, підкреслюють що проблема академічної недоброчесності на сьогодні є дуже серйозною та роботи студентів необхідно перевіряти більш ретельно з використанням ефективних методів для перевірки на плагіат. Мета і задачі дослідження. Метою даного дослідження є розробка ефективного методу перевірки програмного коду на плагіат. Основними завданнями даної роботи є дослідження існуючих статей, публікацій та робіт на тему виявлення плагіату програмного коду, практична перевірка та проведення порівняльного аналізу існуючих рішень з метою подальшого проектування та реалізації більш ефективного та стійкого до вразливостей методу перевірки програмного коду на наявність запозичень. Об’єкт дослідження. Технології та алгоритми, які використовуються для вирішення задачі виявлення випадків плагіату в сирцевому програмному коді. Предмет дослідження. Підходи та алгоритми, що дозволяють розробити ефективну систему для перевірки студентських робіт на плагіат, яка буде захищена від такої вразливості як порушення хешування. Наукова новизна отриманих результатів. Полягає в розробці ефективного алгоритму перевірки програмного коду на плагіат з використанням дерев абстрактного синтаксису та нейронних мереж, що у комбінації надаватиме менше можливостей для атаки колізією хешування. Практичне значення отриманих результатів. Імплементація розробленого алгоритму може бути використана у вищих навчальних закладах з метою перевірки завдань з програмування на наявність запозичень, що дозволить більш ефективно перевіряти роботи, економити час викладача на перевірку, отримати реальний зріз знань студентів та в перспективі підвищити залишковий рівень знань студента з певних дисциплін. Загальний обсяг роботи – 99 сторінок, 42 рисунки, 24 таблиці, 35 посилань.uk
dc.format.page99 с.uk
dc.identifier.citationМироненко, Є. А. Виявлення плагіату програмного коду в студентських роботах : магістерська дис. : 122 Комп'ютерні науки / Мироненко Єлизавета Андріївна. - Київ, 2022. - 99 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/52423
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectPLPuk
dc.subjecttransformersuk
dc.subjectMOSSuk
dc.subjectMossaduk
dc.subjectвиявлення плагіату програмного кодуuk
dc.subjectASTuk
dc.subjectCode2Vecuk
dc.subjectTreeBERTuk
dc.subjecttransformersuk
dc.subjectsource code plagiarism detectionuk
dc.subject.udc004.42uk
dc.titleВиявлення плагіату програмного коду в студентських роботахuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Myronenko_magistr.pdf
Розмір:
3 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: