Застосування сховищ даних для виявлення плагіату в текстових документах
Вантажиться...
Дата
2024
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Наразі більшість інформації зберігається в мережі Інтернет. Це прискорило розповсюдження та створення нової інформації. З одного боку це надає можливість легко спілкуватися та отримувати доступ до велетенської бібліотеки інформації людства. З іншого боку, існує ймовірність що отримана інформація буде направлена не на розвиток людства та створення прогресу та здорової конкуренції, а направлена на копіювання та плагіат чужих ідей та праць. Робота присвячена застосуванню сховищ даних для виявлення плагіату в текстових документах, в результаті якої побудовано масштабовану програмну архітектуру. Проведено дослідження ефективності застосованих сховищ даних та виконано їх порівняльний аналіз. Програмне забезпечення реалізоване мовою Python та Go із застосуванням бібліотек spaCy, pymorphy3.
Опис
Ключові слова
виявлення плагіату, NLP, потік, Apache Hive, DynamoDB, сховища даних
Бібліографічний опис
Галайко, Д. Застосування сховищ даних для виявлення плагіату в текстових документах / Д. Галайко, Ю. Олійник // Адаптивні системи автоматичного управління : міжвідомчий науково-технічний збірник. – 2024. – № 2 (45). – С. 100-108. – Бібліогр.: 14 назв.