Система класифікації текстів методами обробки природної мови та машинного навчання

Вантажиться...
Ескіз

Дата

2019-06

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Структура та обсяг роботи. Пояснювальна записка дипломного проекту складається з шести розділів, містить 20 рисунків, 10 таблиць, 1 додаток та 11 джерел. Дипломний проект присвячений вирішенню задачі класифікації текстів методами обробки природної мови та машинного навчання. Метою створення системи є спрощення процесу класифікації текстів за рахунок створення моделей машинного навчання та оцінки їх ефективності. У розділі загальних положень описано процес діяльності класифікації текстів, побудовано функціональну модель системи що проектується, визначено її відмінності від наявних аналогів. Визначено мету розробки та встановлено задачі, які необхідно вирішити. У розділі інформаційного забезпечення надано детальний опис вхідних та вихідних даних, спроектовано базу даних для збереження результатів. Розділ математичного забезпечення присвячений обґрунтуванню вибраних методів розв’язання задачі та опису алгоритмів на основі яких створюватимуться моделі машинного навчання. Розділ програмного забезпечення описує засоби розробки програмного продукту та етапи проектування його архітектури. Описано специфікацію функцій та звіти, які генеруються в ході запуску програми. У технологічному розділі визначено мету проведення випробувань програмного продукту та описано їх результати. Результати проведеної роботи були опубліковані у міжнародному науковому журналі «Науковий огляд».

Опис

Ключові слова

машинне навчання, обробка текстів, обробка природньої мови, класифікація текстів, machine learning, text processing, natural language processing, model, classification of texts, модель

Бібліографічний опис

Юзьвак, Д. Ю. Система класифікації текстів методами обробки природної мови та машинного навчання : дипломний проект ... бакалавра : 6.050101 Комп'ютерні науки / Юзьвак Дмитро Юрійович. – Київ, 2019. – 95 с.

ORCID

DOI