Математичне та програмне забезпечення визначення авторства художнього тексту
dc.contributor.advisor | Фіногенов, Олексій Дмитрович | |
dc.contributor.author | Храпов, Олег Олегович | |
dc.date.accessioned | 2020-02-11T13:32:34Z | |
dc.date.available | 2020-02-11T13:32:34Z | |
dc.date.issued | 2019-12 | |
dc.description.abstract | Актуальність теми: виконання класифікації художніх текстів людиною (наприклад редактором) на наявність порушення авторських прав або при перевірці плагіату вимагає багато часу. Вирішенням цієї проблеми є автоматизація пошуку автора на основі аналізу стилістичних особливостей письма автора. За рахунок використання машинного навчання можна створити автоматичний класифікатор, який дозволить покращити точність класифікації порівняно з ручною. Мета дослідження: розробити моделі, що забезпечують розпізнавання лексичних та стилістичних ознак автора художнього тексту. Для реалізації поставленої мети були сформульовані наступні завдання: дослідити відомі на даний час методи та підходи визначення стилю автора тексту; збір навчальних даних, розробка класифікатору на основі обраних моделей; тестування та аналіз ефективності використаних моделей; визначення подальшого напряму досліджень. Об’єкт дослідження: стилістичні особливості письмового стилю автора. Визначення автора тексту. Процес визначення характеристик та класифікації художніх текстів на українській мові. Предмет дослідження: лексичні та синтаксичні ознаки письмового стилю автора художнього тексту та алгоритм класифікації текстових даних. Методи дослідження: для розв’язання даної задачі використовувались лексичні та синтаксичні ознаки тексту, нейроні мережі, алгоритм зворотнього поширення помилки. Наукова новизна: найбільш суттєвими науковим результатами магістерської дисертації є розроблена модель визначення автора тексту, проаналізувавши його стилю письма, за допомогою моделі пунктуаційних та функціональних слів текстів написаних на українській мові. Практичне значення отриманих результатів визначається тим, що запропонований та розроблений алгоритм навчання та визначення дозволяє досягти точності визначення автора тексту в 80%, що дозволяє використовувати його для перевірки текстів у визначенні авторських прав або при перевірці документів на плагіат. Зв’язок роботи з науковими програмами, планами, темами: робота виконувалась на кафедрі автоматизованих систем обробки інформації та управління Національного технічного університету України «Київський політехнічний інститут ім. Ігоря Сікорського» в рамках теми «Математичні моделі та технології в СППР». Державний реєстраційний номер 0117U000914. Апробація: результати викладалися на предзахисті роботи на кафедрі АСОІУ. Публікації: Визначення автора тексту з використанням штучних нейронних мереж. Міжнародний електронний науковий журнал - 2019. - №12. - URL: https://nauka-online.com/ua/publications/informatsionnye-tehnologii/ 2019/ 12/ viznachennya-avtora-tekstu-z-vikoristannyam-ann/. Визначення статі автора короткого тексту методами машинного навчання. Міжнародний електронний науковий журнал - 2019. - №11. – URL: https://nauka-online.com/ua/publications/tehnicheskie-nauki/2019/11/opredelenie-pola-avtora-korotkogo-teksta-metodami-mashinnogo-obucheniya/. | uk |
dc.description.abstracten | Topicality of the topic: it takes a long time to classify artistic texts by a person (for example, an editor) for copyright infringement or for plagiarism verification. The solution to this problem is to automate the search for the author based on an analysis of the stylistic features of the author's letter. By using machine learning, you can create an automatic classifier that will improve the accuracy of classification compared to manual. Purpose of the study: to develop models that provide recognition of the lexical and stylistic features of the author of the artistic text. To achieve this goal, the following tasks were formulated: explore currently known methods and approaches for determining the style of the author; collection of training data, development of a classifier based on selected models; testing and analyzing the efficiency of the models used; defining further direction of research. Object of study: stylistic features of the author's writing style. Definition of the author of the text. The process of determining the characteristics and classification of artistic texts in the Ukrainian language. Subject of study: lexical and syntactic features of the written style of the author of the artistic text and algorithm for classification of textual data. Research Methods: To solve this problem, we used lexical and syntactic features of the text, neural networks, the algorithm of reverse error propagation. Scientific novelty: the most significant scientific result of the master's thesis is the developed model of determining the author of the text, analyzing his style of writing, using a model of punctuation and functional words of texts written in Ukrainian. The practical significance of the obtained results is determined by the fact that the proposed and developed algorithm of training and definition allows to achieve the accuracy of the definition of the author of the text in 80%, which allows to use it for verification of texts in the definition of copyright or when checking documents for plagiarism. Relationship with working with scientific programs, plans, topics: work was performed at the Department of Automated Information Processing and Management Systems of the National Technical University of Ukraine «Kyiv Polytechnic Institute. Igor Sikorsky ”within the topic“ Mathematical Models and Technologies in DSS ”. State Registration Number 0117U000914 Testing: the results were taught in pre-protection work at the department of ASOIU. Publications: Identification of the author of the text using artificial neural networks. International Electronic Scientific Journal - 2019. - №12. – URL: https://nauka-online.com/en/publications/informatsionnye-tehnologii/ 2019/12 / viznachennya-avtora-tekstu-z-vikoristannyam-ann/. Defining the gender of the author of the short text by machine learning methods. International Electronic Scientific Journal - 2019. - №11. – URL: https://nauka-online.com/en/publications/tehnicheskie-nauki/2019/11/opredelenie-pola-avtora-korotkogo-teksta-metodami-mashinnogo-obucheniya/. | uk |
dc.format.page | 97 с. | uk |
dc.identifier.citation | Храпов, О. О. Математичне та програмне забезпечення визначення авторства художнього тексту : магістерська дис. : 121 Інженерія програмного забезпечення / Храпов Олег Олегович. - Київ, 2019. - 97 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/31524 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | стилістичні ознаки | uk |
dc.subject | машинне навчання | uk |
dc.subject | класифікація | uk |
dc.subject | визначення автора | uk |
dc.subject | stylistic signs | uk |
dc.subject | machine learning | uk |
dc.subject | classification | uk |
dc.subject | author definition | uk |
dc.subject.udc | 004 | uk |
dc.title | Математичне та програмне забезпечення визначення авторства художнього тексту | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Khrapov_magistr.pdf
- Розмір:
- 3.31 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.06 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: