Система визначення параметрів автора за текстами творів
Вантажиться...
Дата
2020
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Структура та обсяг роботи. Пояснювальна записка дипломного
проєкту складається з шести розділів, містить 22 рисунки, 11 таблиць,
1 додаток, 19 джерел.
Дипломний проєкт присвячений вирішенню комплексу задач зі збору,
обробки, параметризації та атрибуції авторства текстів українською мовою.
Метою роботи є збір корпусу текстів літературних творів українських
письменників та проведення досліджень щодо можливості атрибуції авторства
текстів за допомогою статистичного аналізу, на основі буквосполучень різних
порядків – n-грамів.
У розділі загальних положень описано етапи створення системи
статистичного аналізу текстів за допомогою n-грамів, наведено функціональну
модель системи, зазначено її відмінності від аналогів.
У розділі інформаційного забезпечення описано формат вхідних та
вихідних даних, структури бази даних та файлового сховища для збереження
результатів роботи програмного продукту.
Розділ математичного забезпечення присвячений формалізації обраного
методу статистичного аналізу текстової інформації та обґрунтуванню
доцільності його використання.
Розділ програмного забезпечення описує архітектуру, етапи
проектування, методологію та засоби розробки програмного продукту;
містить діаграму класів та специфікацію функцій.
У технологічному розділі вказано мету проведення випробувань
програмного продукту та описано отримані результати.
Опис
Ключові слова
обробка текстів, атрибуція авторства, корпусна лінгвістика, українська мова, n-грам, text processing, authorship attribution, corpus linguistics, ukrainian language, n-gram
Бібліографічний опис
Мак, О. В. Система визначення параметрів автора за текстами творів : дипломний проект ... бакалавра : 122 Комп'ютерні науки та інформаційні технології / Мак Олексій Володимирович. – Київ, 2020. – 122 с.