Архітектура системи текстової класифікації україномовного контенту для створення рекомендацій

dc.contributor.advisorПавлов, Олександр Анатолійович
dc.contributor.authorОсадча, Ксенія Олександрівна
dc.date.accessioned2023-01-02T13:55:20Z
dc.date.available2023-01-02T13:55:20Z
dc.date.issued2021-12
dc.description.abstractenExplanatory note size – 87 pages, contains 22 illustrations, 28 tables, 3 applications. Topicality. The paper considers the problem in the field of natural language processing, namely the processing of feedback to provide further recommendations, shows the main features of such systems, their advantages and disadvantages. The need for improvement of recommendation systems is revealed. The aim of the study. The main purpose of this work is to increase the efficiency of classification of services or goods through the use of machine learning methods using data augmentation. The criterion of effectiveness is the accuracy of classification. Object of research: software of recommendation systems Subject of research: architectural solutions for creating software for recommendatory text classification systems. To achieve this goal, the following tasks were formulated: - analysis of the problem and existing systems; - analysis of existing architectural solutions of neural networks; - data collection and analysis, their preparation for network training and data augmentation; - improving the network architecture, which most effectively solves the problem of classifying text data; - evaluation of the effectiveness of the proposed solution; - development of software architecture, and, in fact, software. The scientific novelty of the results of the master's dissertation is that the proposed software architecture that increases the accuracy of neural network classification due to the expansion of input data by translating reviews from foreign languages. The result was achieved by creating a system of textual classification of Ukrainian-language content, which will be based on augmented feedback. The practical value of the obtained results is that the architecture of the system of recommendations was developed, which improves the efficiency of neural network classification, due to the expansion of input data, by translating feedback from foreign languages. This system can be used to analyze customer feedback in order to provide further recommendations for business improvement. Relationship with working with scientific programs, plans, topics. Work was performed at the Department of Informatics and Software Engineering of the National Technical University of Ukraine «Kyiv Polytechnic Institute. Igor Sikorsky». Approbation. The scientific provisions of the dissertation have been tested and are located in the collection: Adaptive automatic control systems: interdepartmental scientific and technical collection, № 1 (36). Publications. The scientific provisions of the dissertation published in: Oliinyk, V. Data augmentation with foreign language content in text classification using machine learning / V. Oliinyk, K. Osadcha // Адаптивні системи автоматичного управління : міжвідомчий науково-технічний збірник. – 2020. – № 1 (36). – С. 51– 59. – Бібліогр.: 7 назв.uk
dc.description.abstractukРозмір пояснювальної записки – 87 аркушів, містить 22 ілюстрацій, 28 таблиць, 3 додатки. Актуальність теми. У роботі розглянуто проблему в області обробки природної мови, а саме обробці відгуків для надання подальших рекомендацій, показано основні особливості подібних систем, їх переваги та недоліки. Виявлено потребу в удосконаленні рекомендаційних систем. Мета дослідження. Головною метою цієї роботи є підвищення ефективності класифікації послуг або товарів шляхом застосування методів машинного навчання з використянням аугментації даних. Критерієм ефективності являється точність класифікації. Об’єкт дослідження: програмне забезпечення рекомендаційних систем Предмет дослідження: архітектурні рішення для створення програмного забезпечення рекомендаційних систем текстової класифікації Для реалізації поставленої мети сформульовані наступні завдання: - аналіз проблеми та існуючих систем; - аналіз існуючих архітектурних рішень нейронних мереж; - збір та аналіз даних, їх підготовка до навчання мережі та аугментація даних; - удосконалення архітектури мережі, яка найбільш ефективно вирішує задачу по класифікації текстових даних; - оцінка ефективності запропонованого рішення; - розробка архітектури ПЗ, та, власне, програмного забезпечення. Наукова новизна результатів магістерської дисертації полягає в тому, що запропоновано архітектуру програмного забезпечення, що підвищує точність класифікації нейронної мережі внаслідок розширення вхідних даних за рахунок перекладу відгуків з іноземних мов. Результат досягнутий шляхом створення системи текстової класифікації україномовного контенту, в основу якої будуть покладені аугментовані відгуки. Практичне значення отриманих результатів полягає в тому, що було розроблено архітектуру системи рекомендацій, яка покращує ефективність класифікації нейронної мережі, внаслідок розширення вхідних даних, за рахунок перекладу відгуків з іноземних мов. Дану систему можна використовувати для аналізу відгуків клієнтів-замовників з метою надання подальших рекомендацій стосовно покращення бізнесу. Зв’язок з науковими програмами, планами, темами. Робота виконувалась на кафедрі інформатики та програмної інженерії Національного технічного університету України "Київський політехнічний інститут імені Ігоря Сікорського". Апробація. Наукові положення дисертації пройшли апробацію і розташовуються у зібранні: Адаптивні системи автоматичного управління: міжвідомчий науково-технічний збірник, № 1 (36). Публікації. Наукові положення дисертації опубліковані в: Oliinyk, V. Data augmentation with foreign language content in text classification using machine learning / V. Oliinyk, K. Osadcha // Адаптивні системи автоматичного управління : міжвідомчий науково-технічний збірник. – 2020. – № 1 (36). – С. 51– 59. – Бібліогр.: 7 назв.uk
dc.format.page110 с.uk
dc.identifier.citationОсадча, К. О. Архітектура системи текстової класифікації україномовного контенту для створення рекомендацій : магістерська дис. : 121 Інженерія програмного забезпечення / Осадча Ксенія Олександрівна. - Київ, 2021. - 110 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/51607
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectаналіз тональностіuk
dc.subjectрепрезентативні даніuk
dc.subjectмашинне навчанняuk
dc.subjectаугментація данихuk
dc.subjectsentiment analysisuk
dc.subjectrepresentative datauk
dc.subjectmachine learninguk
dc.subjectdata augmentationuk
dc.subject.udc004.415.25uk
dc.titleАрхітектура системи текстової класифікації україномовного контенту для створення рекомендаційuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Osadcha_magistr.pdf
Розмір:
2.68 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: