Класифiкацiя анотованих текстiв новин за темами методами машинного навчання
dc.contributor.advisor | Ніщенко, Ірина Іванівна | |
dc.contributor.author | Василенко, Наталія Ігорівна | |
dc.date.accessioned | 2021-10-07T06:36:40Z | |
dc.date.available | 2021-10-07T06:36:40Z | |
dc.date.issued | 2021-06 | |
dc.description.abstracten | The research is devoted to the distribution of annotated news of the Ukrainian language by categories. The object of research is machine learning algorithms, famous methods of classifying texts in the Ukrainian language. The subject of research is the models of machine learning, such as the Naive Bayes method, Decision Trees, support vector machine method. Classifiers are also based on the Euclidean distance, Hellinger distance and the cosine measure of similarity. The purpose of the work is to create a classifier for texts in the Ukrainian language, taking into account the morphological properties of the language, as well as to determine which of the methods of machine learning has the highest accuracy in the problem of text classification. In the course of the work the analysis of well-known methods of machine learning and their comparative analysis was carried out. The process of passing texts through the necessary stages of its processing and creation of a classifier for Ukrainian-language texts is described. Algorithms have been developed that allow to classify news into categories with sufficient accuracy. | uk |
dc.description.abstractuk | Квалiфiкацiйна робота мiстить: 89 стор., 52 рисунки, 3 таблицi, 19 джерел. Дослiдження присвячено розподiлу анотованих новин українскої мови за категорiями. Об’єктом дослiдження є процедури класифiкацiї текстiв українською мовою за допомогою машинного навчання. Предметом дослiдження є моделi машинного навчання, а саме методи: дерев прийняття рiшень, опорних векторiв та наївний баєсовий метод. Також класифiкатори побудованi на основi мiр Евклiда, Хелiнгера та косинусної мiри подiбностi. Мета роботи - створити класифiкатор для текстiв української мови, враховуючи морфологiчнi властивостi мови, а також визначити, який з методiв машинного навчання має найвищу точнiсть у задачi класифiкацiї текстiв. У ходi виконання роботи проведено аналiз широковiдомих методiв машинного навчання та їх порiвняльний аналiз. Описано процес проходження текстiв через необхiднi етапи його обробки та створено класифiкатор для україномовних текстiв. Розроблено алгоритми, якi дозволяють класифiкувати новини за категорiями з достатньою точнiстю. | uk |
dc.format.page | 89 с. | uk |
dc.identifier.citation | Василенко, Н. I. Класифiкацiя анотованих текстiв новин за темами методами машинного навчання : дипломна робота … бакалавра : 113 Прикладна математика / Василенко Наталiя Iгорiвна. – Київ, 2021. – 89 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/44229 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | машинне навчання | uk |
dc.subject | класифiкацiя текстiв | uk |
dc.subject | мiра Евклiда | uk |
dc.subject | мiра Хелiнгера | uk |
dc.subject | метод опорних векторiв | uk |
dc.subject | наївний баєсовий метод | uk |
dc.subject | метод дерев прийняття рiшень | uk |
dc.subject | Python | uk |
dc.subject | machine learning | uk |
dc.subject | classification of texts | uk |
dc.subject | Euclidean distance | uk |
dc.subject | Hellinger distance | uk |
dc.subject | support vectors machine | uk |
dc.subject | naive Bayes method | uk |
dc.subject | decision tree | uk |
dc.title | Класифiкацiя анотованих текстiв новин за темами методами машинного навчання | uk |
dc.type | Bachelor Thesis | uk |