Математичне та програмне забезпечення визначення авторства художнього тексту

Вантажиться...
Ескіз

Дата

2019-12

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Актуальність теми: виконання класифікації художніх текстів людиною (наприклад редактором) на наявність порушення авторських прав або при перевірці плагіату вимагає багато часу. Вирішенням цієї проблеми є автоматизація пошуку автора на основі аналізу стилістичних особливостей письма автора. За рахунок використання машинного навчання можна створити автоматичний класифікатор, який дозволить покращити точність класифікації порівняно з ручною. Мета дослідження: розробити моделі, що забезпечують розпізнавання лексичних та стилістичних ознак автора художнього тексту. Для реалізації поставленої мети були сформульовані наступні завдання:  дослідити відомі на даний час методи та підходи визначення стилю автора тексту;  збір навчальних даних, розробка класифікатору на основі обраних моделей;  тестування та аналіз ефективності використаних моделей;  визначення подальшого напряму досліджень. Об’єкт дослідження: стилістичні особливості письмового стилю автора. Визначення автора тексту. Процес визначення характеристик та класифікації художніх текстів на українській мові. Предмет дослідження: лексичні та синтаксичні ознаки письмового стилю автора художнього тексту та алгоритм класифікації текстових даних. Методи дослідження: для розв’язання даної задачі використовувались лексичні та синтаксичні ознаки тексту, нейроні мережі, алгоритм зворотнього поширення помилки. Наукова новизна: найбільш суттєвими науковим результатами магістерської дисертації є розроблена модель визначення автора тексту, проаналізувавши його стилю письма, за допомогою моделі пунктуаційних та функціональних слів текстів написаних на українській мові. Практичне значення отриманих результатів визначається тим, що запропонований та розроблений алгоритм навчання та визначення дозволяє досягти точності визначення автора тексту в 80%, що дозволяє використовувати його для перевірки текстів у визначенні авторських прав або при перевірці документів на плагіат. Зв’язок роботи з науковими програмами, планами, темами: робота виконувалась на кафедрі автоматизованих систем обробки інформації та управління Національного технічного університету України «Київський політехнічний інститут ім. Ігоря Сікорського» в рамках теми «Математичні моделі та технології в СППР». Державний реєстраційний номер 0117U000914. Апробація: результати викладалися на предзахисті роботи на кафедрі АСОІУ. Публікації: Визначення автора тексту з використанням штучних нейронних мереж. Міжнародний електронний науковий журнал - 2019. - №12. - URL: https://nauka-online.com/ua/publications/informatsionnye-tehnologii/ 2019/ 12/ viznachennya-avtora-tekstu-z-vikoristannyam-ann/. Визначення статі автора короткого тексту методами машинного навчання. Міжнародний електронний науковий журнал - 2019. - №11. – URL: https://nauka-online.com/ua/publications/tehnicheskie-nauki/2019/11/opredelenie-pola-avtora-korotkogo-teksta-metodami-mashinnogo-obucheniya/.

Опис

Ключові слова

стилістичні ознаки, машинне навчання, класифікація, визначення автора, stylistic signs, machine learning, classification, author definition

Бібліографічний опис

Храпов, О. О. Математичне та програмне забезпечення визначення авторства художнього тексту : магістерська дис. : 121 Інженерія програмного забезпечення / Храпов Олег Олегович. - Київ, 2019. - 97 с.

DOI