Класифiкацiя анотованих текстiв новин за темами методами машинного навчання
Вантажиться...
Дата
2021-06
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Квалiфiкацiйна робота мiстить: 89 стор., 52 рисунки, 3 таблицi, 19 джерел.
Дослiдження присвячено розподiлу анотованих новин українскої мови за категорiями.
Об’єктом дослiдження є процедури класифiкацiї текстiв українською мовою за допомогою машинного навчання. Предметом дослiдження є моделi машинного навчання, а саме методи: дерев прийняття рiшень, опорних векторiв та наївний баєсовий метод. Також класифiкатори побудованi на основi мiр Евклiда, Хелiнгера та косинусної мiри подiбностi.
Мета роботи - створити класифiкатор для текстiв української мови, враховуючи морфологiчнi властивостi мови, а також визначити, який з методiв машинного навчання має найвищу точнiсть у задачi класифiкацiї текстiв.
У ходi виконання роботи проведено аналiз широковiдомих методiв машинного навчання та їх порiвняльний аналiз. Описано процес проходження текстiв через необхiднi етапи його обробки та створено класифiкатор для україномовних текстiв. Розроблено алгоритми, якi дозволяють класифiкувати новини за категорiями з достатньою точнiстю.
Опис
Ключові слова
машинне навчання, класифiкацiя текстiв, мiра Евклiда, мiра Хелiнгера, метод опорних векторiв, наївний баєсовий метод, метод дерев прийняття рiшень, Python, machine learning, classification of texts, Euclidean distance, Hellinger distance, support vectors machine, naive Bayes method, decision tree
Бібліографічний опис
Василенко, Н. I. Класифiкацiя анотованих текстiв новин за темами методами машинного навчання : дипломна робота … бакалавра : 113 Прикладна математика / Василенко Наталiя Iгорiвна. – Київ, 2021. – 89 с.