Інформаційна система класифікації тональності тексту

dc.contributor.advisorСперкач, Майя Олегівна
dc.contributor.authorШилюк, Девід Васильович
dc.date.accessioned2023-07-05T09:26:46Z
dc.date.available2023-07-05T09:26:46Z
dc.date.issued2022-12-31
dc.description.abstractПояснювальна записка дипломного проекту складається з шести розділів, містить 29 таблиць, 13 додатків та 44 джерел – загалом 120 сторінок. Об`єкт дослідження: методи аналізу тональності тексту. Мета магістерської дисертації: спрощення процесу прийняття рішень для визначення емоційного забарвлення текстових коментарів стосовно заданого об'єкту (товар, послуга, фільм тощо). У першому розділі проведений аналіз аналогів існуючих систем, який показав, що розробка нової системи є актуальною. У другому розділі проведено огляд існуючих методів обробки текстових даних та їх векторизації. Також описано математичну основу обраних для дослідження алгоритмів класифікації на основі методів машинного навчання з вчителем, виділено їх переваги та недоліки. У третьому обґрунтовано засоби розробки, спроектовані діаграми компонентів, розгортання та послідовності, які описують архітектуру програмного забезпечення. У четвертому розділі описано практичну реалізацію системи від самого початку: вибір даних для навчання та тестування класифікаторів, методи обробки текстових даних, їх векторизації та агрегації, технічні аспекти реалізації класичних алгоритмів класифікації та запропонована модель на основі рекурентної нейронної мережі. У п’ятому розділі описано перелік випробувань алгоритмів, порівняння отриманих результатів тестування моделей власної реалізації та взятих з бібліотеки. Підсумовано переваги власних реалізацій алгоритмів, запропонована та реалізована модифікація нейронної мережі для підвищення точності класифікації. Шостий розділ магістерської дисертації присвячений розробці стартап-проекту.uk
dc.description.abstractotherExplanatory note of the diploma project consists of six chapters, contains 29 tables, 13 appendices and 44 sources - a total of 120 pages. Object of research: methods of text tone analysis. The aim of the diploma project: simplification of the decision-making process to determine the emotional coloring of text comments on a given object (product, service, film, etc.). The first section analyzes the analogues of existing systems, which showed that the development of a new system is relevant. The second section reviews existing methods of text data processing and vectorization. It also describes the mathematical basis of the selected for the study classification algorithms based on supervised machine learning methods, highlighting their advantages and disadvantages. In the third, the development tools are substantiated, component diagrams, deployment and sequences that describe the software architecture are designed. The fourth section describes the practical implementation of the system from the very beginning: the choice of data for training and testing classifiers, methods of processing text data, their vectorization and aggregation, technical aspects of the implementation of classical classification algorithms and the proposed model based on a recurrent neural network. The fifth section describes the list of tests of algorithms, comparison of the obtained results of testing models of own implementation and those taken from the library. The advantages of own implementations of the algorithms are summarized, a modification of the neural network to improve the accuracy of classification is proposed and implemented. The sixth chapter of the master's thesis is devoted to the development of a startup project.uk
dc.format.extent120 с.uk
dc.identifier.citationШилюк, Д. В. Інформаційна система класифікації тональності тексту : магістерська дис. : 126 Інформаційні системи та технології / Шилюк Девід Васильович. – Київ, 2022. – 120 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/57887
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectрекурентна нейронна мережаuk
dc.subjectсентимент аналізуuk
dc.subjectтональністьuk
dc.subjectобробка текстових данихuk
dc.subjectпрограмний застосунокuk
dc.subject.udc004.855.5uk
dc.titleІнформаційна система класифікації тональності текстуuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Shyliuk_magistr.pdf
Розмір:
2.26 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: