Web-сервіс з передбаченням жанру і тональності тексту

dc.contributor.advisorКублій, Лариса Іванівна
dc.contributor.authorЄрохіна, Анна Олексіївна
dc.date.accessioned2020-09-24T16:25:42Z
dc.date.available2020-09-24T16:25:42Z
dc.date.issued2020
dc.description.abstractenThe purpose of the thesis is to study and develop software to predict the genre of the textual description of the film and determine its tone using machine learning technologies. Analysis of features, disadvantages and advantages of the used classification methods, substantiation of the chosen final method. The result of the program can be used when filling in the information about the film by the administrator of the service for watching movies. The following multi-label classification methods were used during the work: Binary Relevance, Classifier Chains, Label Powerset and RAkelD. There are also 7 variants of neural networks with "memory". The best result was given by the network with the GRU layer — 0.53 on the accuracy metric.uk
dc.description.abstractruЦелью дипломной работы является исследование и разработка программного обеспечения для предсказания жанра по текстовым данным и определение их тональности с использованием технологий машинного обучения. Анализ особенностей, недостатков и преимуществ использованных приемов классификации, обоснование выбранного конечного метода. Результат работы программы может быть использован как подсказка человеку-оператору при вводе текста, который требует определения категории. Модель построена на примере предсказания жанров фильма. Во время выполнения работы были использованы следующие методы многометковой классификации: Binary Relevance, Classifier Chains, Label Powerset и RAkelD. Также разработаны 7 вариантов нейронных сетей с «памятью». Лучший результат дала сеть со слоями GRU и LSTM - 0,91 по метрике roc-micro.uk
dc.description.abstractukМетою дипломної роботи є дослідження і розробка програмного забезпечення для передбачення жанру за текстовими даними та визначення їх тональності з використанням технологій машинного навчання. Аналіз особливостей, недоліків та переваг використаних прийомів класифікації, обґрунтування обраного кінцевого методу. Результат роботи програми може бути використаний як підказка людині-оператору при введенні тексту, що вимагає визначення певної категорії. Модель побудована на прикладі передбачення жанрів фільму. Під час виконання роботи було використано такі методи багатоміткової класифікації: Binary Relevance, Classifier Chains, Label Powerset і RAkelD. Також розроблено 7 варіантів нейронних мереж з «пам’яттю». Найкращий результат дала мережа з шарами GRU і LSTM — 0,91 за метрикою roc-micro.uk
dc.format.page70 с.uk
dc.identifier.citationЄрохіна, А. О. Web-сервіс з передбаченням жанру і тональності тексту : дипломна робота ... бакалавра : 121 Інженерія програмного забезпечення / Єрохіна Анна Олексіївна. – Київ, 2020. – 70 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/36402
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectмашинне навчанняuk
dc.subjectбагатоміткова класифікаціяuk
dc.subjectтональність текстуuk
dc.subjectнейронна мережаuk
dc.subjectsentiment analysisuk
dc.subjectneural networuk
dc.subjectmachine learninguk
dc.subjectmultilabel classificationuk
dc.titleWeb-сервіс з передбаченням жанру і тональності текстуuk
dc.typeBachelor Thesisuk

Файли