Система визначення параметрів автора за текстами творів

Вантажиться...
Ескіз

Дата

2020

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Структура та обсяг роботи. Пояснювальна записка дипломного проєкту складається з шести розділів, містить 22 рисунки, 11 таблиць, 1 додаток, 19 джерел. Дипломний проєкт присвячений вирішенню комплексу задач зі збору, обробки, параметризації та атрибуції авторства текстів українською мовою. Метою роботи є збір корпусу текстів літературних творів українських письменників та проведення досліджень щодо можливості атрибуції авторства текстів за допомогою статистичного аналізу, на основі буквосполучень різних порядків – n-грамів. У розділі загальних положень описано етапи створення системи статистичного аналізу текстів за допомогою n-грамів, наведено функціональну модель системи, зазначено її відмінності від аналогів. У розділі інформаційного забезпечення описано формат вхідних та вихідних даних, структури бази даних та файлового сховища для збереження результатів роботи програмного продукту. Розділ математичного забезпечення присвячений формалізації обраного методу статистичного аналізу текстової інформації та обґрунтуванню доцільності його використання. Розділ програмного забезпечення описує архітектуру, етапи проектування, методологію та засоби розробки програмного продукту; містить діаграму класів та специфікацію функцій. У технологічному розділі вказано мету проведення випробувань програмного продукту та описано отримані результати.

Опис

Ключові слова

обробка текстів, атрибуція авторства, корпусна лінгвістика, українська мова, n-грам, text processing, authorship attribution, corpus linguistics, ukrainian language, n-gram

Бібліографічний опис

Мак, О. В. Система визначення параметрів автора за текстами творів : дипломний проект ... бакалавра : 122 Комп'ютерні науки та інформаційні технології / Мак Олексій Володимирович. – Київ, 2020. – 122 с.

ORCID

DOI