Класифiкацiя анотованих текстiв новин за темами методами машинного навчання

dc.contributor.advisorНіщенко, Ірина Іванівна
dc.contributor.authorВасиленко, Наталія Ігорівна
dc.date.accessioned2021-10-07T06:36:40Z
dc.date.available2021-10-07T06:36:40Z
dc.date.issued2021-06
dc.description.abstractenThe research is devoted to the distribution of annotated news of the Ukrainian language by categories. The object of research is machine learning algorithms, famous methods of classifying texts in the Ukrainian language. The subject of research is the models of machine learning, such as the Naive Bayes method, Decision Trees, support vector machine method. Classifiers are also based on the Euclidean distance, Hellinger distance and the cosine measure of similarity. The purpose of the work is to create a classifier for texts in the Ukrainian language, taking into account the morphological properties of the language, as well as to determine which of the methods of machine learning has the highest accuracy in the problem of text classification. In the course of the work the analysis of well-known methods of machine learning and their comparative analysis was carried out. The process of passing texts through the necessary stages of its processing and creation of a classifier for Ukrainian-language texts is described. Algorithms have been developed that allow to classify news into categories with sufficient accuracy.uk
dc.description.abstractukКвалiфiкацiйна робота мiстить: 89 стор., 52 рисунки, 3 таблицi, 19 джерел. Дослiдження присвячено розподiлу анотованих новин українскої мови за категорiями. Об’єктом дослiдження є процедури класифiкацiї текстiв українською мовою за допомогою машинного навчання. Предметом дослiдження є моделi машинного навчання, а саме методи: дерев прийняття рiшень, опорних векторiв та наївний баєсовий метод. Також класифiкатори побудованi на основi мiр Евклiда, Хелiнгера та косинусної мiри подiбностi. Мета роботи - створити класифiкатор для текстiв української мови, враховуючи морфологiчнi властивостi мови, а також визначити, який з методiв машинного навчання має найвищу точнiсть у задачi класифiкацiї текстiв. У ходi виконання роботи проведено аналiз широковiдомих методiв машинного навчання та їх порiвняльний аналiз. Описано процес проходження текстiв через необхiднi етапи його обробки та створено класифiкатор для україномовних текстiв. Розроблено алгоритми, якi дозволяють класифiкувати новини за категорiями з достатньою точнiстю.uk
dc.format.page89 с.uk
dc.identifier.citationВасиленко, Н. I. Класифiкацiя анотованих текстiв новин за темами методами машинного навчання : дипломна робота … бакалавра : 113 Прикладна математика / Василенко Наталiя Iгорiвна. – Київ, 2021. – 89 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/44229
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectмашинне навчанняuk
dc.subjectкласифiкацiя текстiвuk
dc.subjectмiра Евклiдаuk
dc.subjectмiра Хелiнгераuk
dc.subjectметод опорних векторiвuk
dc.subjectнаївний баєсовий методuk
dc.subjectметод дерев прийняття рiшеньuk
dc.subjectPythonuk
dc.subjectmachine learninguk
dc.subjectclassification of textsuk
dc.subjectEuclidean distanceuk
dc.subjectHellinger distanceuk
dc.subjectsupport vectors machineuk
dc.subjectnaive Bayes methoduk
dc.subjectdecision treeuk
dc.titleКласифiкацiя анотованих текстiв новин за темами методами машинного навчанняuk
dc.typeBachelor Thesisuk

Файли