Математичне та програмне забезпечення сентиментального аналізу текстової інформації
Ескіз недоступний
Дата
2018
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
Актуальність теми:
а) Покращення якості продукції на основі вивчення запитів користувачів в Інтернеті: соціальних мережах, блогах, сайтів інтернет-сервісів.
б) Ефективний інструмент моніторингу і оцінювання конкретних груп користувачів.
Мета дослідження: розробка методів і програмних засобів аналізу висловлювань, пов'язаних з проблемними ситуаціями враховуючи особливості неструктурованих текстів користувачів в колекції відгуків предметної області.
Для реалізації поставленої мети були сформульовані наступні завдання:
а) провести класифікацію відгуків користувачів про різні види проблем з продуктами;
б) створити словники проблемних індикаторів і оцінних слів;
в) розробити такі методи класифікації: метод, заснований на правилах і словниках; метод, заснований на граматичної структурі складних речень щодо сполучників;
г) розробити метод визначення проблемних фраз по відношенню до об'єктів, щодо яких висловлюється проблемна фраза (далі цільові об'єкти) і пов'язаних з предметною областю, на основі загальнодоступного тезауруса;
д) реалізувати запропоновані методи у вигляді програмного засобу і провести експериментальні дослідження з метою визначення якості роботи методів і моделей з використанням створених колекцій текстових документів.
Об’єкт дослідження: думки користувачів про продукти і сервіси компаній, представлені у вигляді неструктурованих текстів на природній мові і доступні через Інтернет
Предмет дослідження: дослідження виступають завдання виділення інформації з висловлювань користувачів, що містять вказівки на труднощі у використанні продуктів, неможливість використання внаслідок помилок або недоліків товару.
Методи дослідження: У даній дисертаційній роботі застосовуються методи обробки природної мови, засновані на правилах, словниках та існуючих лінгвістичних ресурсах.
Наукова новизна: У даній роботі запропоновані нові методи вилучення висловлювань в задачах аналізу думок користувачів різних предметних областей, засновані на алгоритмах машинного навчання без учителя, словниках і використанні структурної інформації лінгвістичного тезауруса.
Практичне значення отриманих результатів. Запропоновані методи до витянення висловлювань з колекції відгуків предметної області можуть бути використані при вирішенні прикладних задач аналізу думок: класифікації текстових документів, виділення якісної інформації, кластеризації інформації на основі тематичних моделей і т.п.
Апробація: Основні положення роботи доповідались і обговорювались на
Публікації: Наукові положення дисертації опубліковані в.
Опис
Ключові слова
семантичний аналіз, аналіз тональності, словник ключових слів, кластеризація, analysis of completeness, dictionary of key elements, semantic analysis, clustering
Бібліографічний опис
Кобилинський, Д. А. Інтелектуальна система розміщення рекламного контенту : магістерська дис. : 121 Інженерія програмного забезпечення / Кобилинський Дмитро Анатолійович. – Київ, 2018. – 95 с.