Гібридизація способів детекції плагіаризму в програмному коді
dc.contributor.advisor | Павловський, Володимир Ілліч | |
dc.contributor.author | Бойко, Владислав Володимирович | |
dc.date.accessioned | 2022-01-18T11:51:34Z | |
dc.date.available | 2022-01-18T11:51:34Z | |
dc.date.issued | 2021 | |
dc.description.abstracten | Actuality of theme. We live in the age of progressive development of computer technology. Nowadays, software appears and develops with great speed and trends in technology is changing daily. At the same time there are problems of plagiarism, where plagiarism in program code means parts or complete duplication of fragments of the program code. The term duplication can be considered as identical fragments of code within one program, and plagiarism in different programs. Detection of plagiarism always remains an urgent task in software development as a tool of metric analysis and refactoring. Today, there are a large number of software products that helps to identify plagiarism in program code. A significant number of integrated development environments includes appropriate extensions to facilitate the development, maintenance and implementation of software products, because the accumulation of large amounts of duplicate program code can lead to many problems, because when detecting errors in a particular piece of code, all duplicate fragments must be modified, which can greatly complicate the implementation and maintenance of the software product. Due to the detection of plagiarism, duplicate code can be abstracted and, as a result, the overall size of the program code can be reduced. In addition, the detection of plagiarism in program code can be used of projects refactoring, reduce the code base and find violations of copy-writing rights. The object of the study is the plagiarism detection in program code. The subject of the study is a hybrid method of determining software clones in input programs. Purpose: an analysis of plagiarism detection in software code with purpose of developing of new software using hybrid approaches. Research methods. Methods of discrete mathematics, experimental method. The scientific novelty is: A new method of detecting plagiarism in program code is proposed, which enables the detection of plagiarism for a wide range of programming languages, improving the results of existing approaches. The practical value of the results obtained is that the proposed method is a universal solution in this sphere, providing the ability to detect plagiarism for a wide range of programming languages without loss of efficiency and can be used as a tool to facilitate software development, also provides the ability to integrate with other software. Testing the work. The main provisions and results of the work were presented on the PMK-2021 and VIII International scientific Internet-conference. Structure and scope of work. Introduction is a general description of the work, the estimation of a modern condition of a problem is made, the urgency of a direction of researches is proved, the purpose and tasks of researches are formulated and practical value of work is shown. The first section discusses the main techniques for detecting plagiarism, the software that implements them, their advantages and disadvantages. The second section provides information about the methods, algorithms and tools that is used to process program code in this work. The third section describes developed method and stages of its implementation. The fourth section contains testing of this software package to prove the correctness of the work. The master's thesis is made on 80 papers, contains 3 appendices and links to the list of used literature sources with 20 titles. 36 drawings and 4 tables are presented in the paper. | uk |
dc.description.abstractuk | Актуальність теми. Ми живемо у вік прогресивного розвитку комп’ютерних технологій. В наш час програмні продукти з’являються і розвиваються з неймовірною швидкістю, тенденції і тренди на технології змінюються щоденно. Одночасно виникають і проблеми плагіаризму, де під плагіаризмом в програмному коді розуміють часткове або повне дублювання фрагментів коду програми. Під терміном дублювання можна розглядати як ідентичні фрагменти коду в рамках однієї програми, так і плагіаризм у різних програмах. Детекція плагіаризму завжди була і залишається актуальною задачею в розробці програмного забезпечення, як інструмент метричного аналізу і рефакторингу. На сьогодні існує велика кількість програмних продуктів, які допомагають ідентифікувати плагіаризм у програмному коді. Значна кількість інтегрованих середовищ розробки містить у собі відповідні розширення для полегшення розробки, підтримки і впровадження програмних продуктів, тому що накопичування великої кількості дублюючого програмного коду може призводити до виникнення значної кількості проблем, оскільки при детекції помилок в певному фрагменті коду, всі дублюючі фрагменти також повинні бути модифіковані, що може значно ускладнити впровадження і підтримку програмного продукту. Завдяки детекції плагіаризму дублюючий код може абстрагуватися і, як результат, загальний розмір програмного коду може бути зменшений. Крім того детекція плагіаризму в програмному коді може використовуватися для рефакторингу проєктів, зменшення кодової бази та пошуку порушення прав копірайтингу. Об’єктом дослідження є детекція плагіаризму в програмному коді. Предметом дослідження є гібридизація способів визначення програмних клонів у вхідних програмах. Мета роботи: розробка нового гібридного підходу для більш ефективної детекції плагіаризму порівняно з аналогами. Наукова новизна полягає в наступному: запропоновано гібридний спосіб детекції плагіаризму у програмному коді, який дає можливість детекції плагіаризму для широкого спектру мов програмування, забезпечуючи покращення результатів існуючих підходів. Практична цінність отриманих в роботі результатів полягає в тому, що запропонований спосіб є універсальним рішенням для даної сфери, забезпечуючи можливість детекції плагіаризму для широкого спектру мов програмування без втрати ефективності і має можливість застосування як інструмент для полегшення процесу розробки програмного забезпечення, також передбачена можливість інтеграції з іншим програмним забезпеченням. Апробація роботи. Основні положення і результати роботи були представлені та обговорювались на: 1. XIV науковій конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг» ПМК-2021 (Київ, 17-19 листопада 2021 р.); 2. VІIІ Міжнародній науково-технічній Internet-конференції «Сучасні методи, інформаційне, програмне та технічне забезпечення систем керування організаційно-технічними та технологічними комплексами» (Київ, 26 листопада 2021р.). Структура та обсяг роботи. Магістерська дисертація складається з вступу, чотирьох розділів та висновків. У вступі подано загальну характеристику роботи, зроблено оцінку сучасного стану проблеми, обґрунтовано актуальність напрямку досліджень, сформульовано мету і задачі досліджень та показано практичну цінність роботи. У першому розділі розглянуто основні техніки детекції плагіаризму, програмне забезпечення, яке їх реалізує, їх переваги та недоліки. У другому розділі наведено відомості про методи, алгоритми та інструменти, які використовуються для обробки програмного коду в магістерській роботі. У третьому розділі подано опис розробленого способу та етапів його реалізації. У четвертому розділі міститься тестування даного програмного комплексу з метою доведення правильності роботи. У висновках представлені результати проведеної роботи. Робота представлена на 80 аркушах, містить посилання на список використаних літературних джерел. | uk |
dc.format.page | 88 с. | uk |
dc.identifier.citation | Бойко, В. В. Гібридизація способів детекції плагіаризму в програмному коді : магістерська дис. : 123 Комп’ютерна інженерія / Бойко Владислав Володимирович. – Київ, 2021. – 88 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/45923 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | детекція | uk |
dc.subject | плагіаризм | uk |
dc.subject | detection | uk |
dc.subject | plagiarism | uk |
dc.subject.udc | 004.054 | uk |
dc.title | Гібридизація способів детекції плагіаризму в програмному коді | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Boyko_magistr.pdf
- Розмір:
- 1.36 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: