Архітектура системи текстової класифікації україномовного контенту для створення рекомендацій

Вантажиться...
Ескіз

Дата

2021-12

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Розмір пояснювальної записки – 87 аркушів, містить 22 ілюстрацій, 28 таблиць, 3 додатки. Актуальність теми. У роботі розглянуто проблему в області обробки природної мови, а саме обробці відгуків для надання подальших рекомендацій, показано основні особливості подібних систем, їх переваги та недоліки. Виявлено потребу в удосконаленні рекомендаційних систем. Мета дослідження. Головною метою цієї роботи є підвищення ефективності класифікації послуг або товарів шляхом застосування методів машинного навчання з використянням аугментації даних. Критерієм ефективності являється точність класифікації. Об’єкт дослідження: програмне забезпечення рекомендаційних систем Предмет дослідження: архітектурні рішення для створення програмного забезпечення рекомендаційних систем текстової класифікації Для реалізації поставленої мети сформульовані наступні завдання: - аналіз проблеми та існуючих систем; - аналіз існуючих архітектурних рішень нейронних мереж; - збір та аналіз даних, їх підготовка до навчання мережі та аугментація даних; - удосконалення архітектури мережі, яка найбільш ефективно вирішує задачу по класифікації текстових даних; - оцінка ефективності запропонованого рішення; - розробка архітектури ПЗ, та, власне, програмного забезпечення. Наукова новизна результатів магістерської дисертації полягає в тому, що запропоновано архітектуру програмного забезпечення, що підвищує точність класифікації нейронної мережі внаслідок розширення вхідних даних за рахунок перекладу відгуків з іноземних мов. Результат досягнутий шляхом створення системи текстової класифікації україномовного контенту, в основу якої будуть покладені аугментовані відгуки. Практичне значення отриманих результатів полягає в тому, що було розроблено архітектуру системи рекомендацій, яка покращує ефективність класифікації нейронної мережі, внаслідок розширення вхідних даних, за рахунок перекладу відгуків з іноземних мов. Дану систему можна використовувати для аналізу відгуків клієнтів-замовників з метою надання подальших рекомендацій стосовно покращення бізнесу. Зв’язок з науковими програмами, планами, темами. Робота виконувалась на кафедрі інформатики та програмної інженерії Національного технічного університету України "Київський політехнічний інститут імені Ігоря Сікорського". Апробація. Наукові положення дисертації пройшли апробацію і розташовуються у зібранні: Адаптивні системи автоматичного управління: міжвідомчий науково-технічний збірник, № 1 (36). Публікації. Наукові положення дисертації опубліковані в: Oliinyk, V. Data augmentation with foreign language content in text classification using machine learning / V. Oliinyk, K. Osadcha // Адаптивні системи автоматичного управління : міжвідомчий науково-технічний збірник. – 2020. – № 1 (36). – С. 51– 59. – Бібліогр.: 7 назв.

Опис

Ключові слова

аналіз тональності, репрезентативні дані, машинне навчання, аугментація даних, sentiment analysis, representative data, machine learning, data augmentation

Бібліографічний опис

Осадча, К. О. Архітектура системи текстової класифікації україномовного контенту для створення рекомендацій : магістерська дис. : 121 Інженерія програмного забезпечення / Осадча Ксенія Олександрівна. - Київ, 2021. - 110 с.

ORCID

DOI