Інформаційна система класифікації тональності тексту
dc.contributor.advisor | Сперкач, Майя Олегівна | |
dc.contributor.author | Шилюк, Девід Васильович | |
dc.date.accessioned | 2023-07-05T09:26:46Z | |
dc.date.available | 2023-07-05T09:26:46Z | |
dc.date.issued | 2022-12-31 | |
dc.description.abstract | Пояснювальна записка дипломного проекту складається з шести розділів, містить 29 таблиць, 13 додатків та 44 джерел – загалом 120 сторінок. Об`єкт дослідження: методи аналізу тональності тексту. Мета магістерської дисертації: спрощення процесу прийняття рішень для визначення емоційного забарвлення текстових коментарів стосовно заданого об'єкту (товар, послуга, фільм тощо). У першому розділі проведений аналіз аналогів існуючих систем, який показав, що розробка нової системи є актуальною. У другому розділі проведено огляд існуючих методів обробки текстових даних та їх векторизації. Також описано математичну основу обраних для дослідження алгоритмів класифікації на основі методів машинного навчання з вчителем, виділено їх переваги та недоліки. У третьому обґрунтовано засоби розробки, спроектовані діаграми компонентів, розгортання та послідовності, які описують архітектуру програмного забезпечення. У четвертому розділі описано практичну реалізацію системи від самого початку: вибір даних для навчання та тестування класифікаторів, методи обробки текстових даних, їх векторизації та агрегації, технічні аспекти реалізації класичних алгоритмів класифікації та запропонована модель на основі рекурентної нейронної мережі. У п’ятому розділі описано перелік випробувань алгоритмів, порівняння отриманих результатів тестування моделей власної реалізації та взятих з бібліотеки. Підсумовано переваги власних реалізацій алгоритмів, запропонована та реалізована модифікація нейронної мережі для підвищення точності класифікації. Шостий розділ магістерської дисертації присвячений розробці стартап-проекту. | uk |
dc.description.abstractother | Explanatory note of the diploma project consists of six chapters, contains 29 tables, 13 appendices and 44 sources - a total of 120 pages. Object of research: methods of text tone analysis. The aim of the diploma project: simplification of the decision-making process to determine the emotional coloring of text comments on a given object (product, service, film, etc.). The first section analyzes the analogues of existing systems, which showed that the development of a new system is relevant. The second section reviews existing methods of text data processing and vectorization. It also describes the mathematical basis of the selected for the study classification algorithms based on supervised machine learning methods, highlighting their advantages and disadvantages. In the third, the development tools are substantiated, component diagrams, deployment and sequences that describe the software architecture are designed. The fourth section describes the practical implementation of the system from the very beginning: the choice of data for training and testing classifiers, methods of processing text data, their vectorization and aggregation, technical aspects of the implementation of classical classification algorithms and the proposed model based on a recurrent neural network. The fifth section describes the list of tests of algorithms, comparison of the obtained results of testing models of own implementation and those taken from the library. The advantages of own implementations of the algorithms are summarized, a modification of the neural network to improve the accuracy of classification is proposed and implemented. The sixth chapter of the master's thesis is devoted to the development of a startup project. | uk |
dc.format.extent | 120 с. | uk |
dc.identifier.citation | Шилюк, Д. В. Інформаційна система класифікації тональності тексту : магістерська дис. : 126 Інформаційні системи та технології / Шилюк Девід Васильович. – Київ, 2022. – 120 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/57887 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | рекурентна нейронна мережа | uk |
dc.subject | сентимент аналізу | uk |
dc.subject | тональність | uk |
dc.subject | обробка текстових даних | uk |
dc.subject | програмний застосунок | uk |
dc.subject.udc | 004.855.5 | uk |
dc.title | Інформаційна система класифікації тональності тексту | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Shyliuk_magistr.pdf
- Розмір:
- 2.26 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: