Автоматична оцінка тональності тексту
Ескіз недоступний
Дата
2018-12
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
Структура та обсяг дипломної роботи
Магістерська дисертація складається зі вступу, шести розділів, висновку, переліку посилань з 32 найменувань, 2 додатків, та містить 44 рисунки і 14 таблиць.
Повний обсяг магістерської дисертації складає 104 сторінок, з яких перелік посилань займає 3 сторінки, додатки — 12 сторінок.
Актуальність теми. Емотивне навантаження думок людей у суспільстві є дуже важливим аспектом під час обробки великих обсягів інформації з метою виявлення споживацьких потреб у сфері маркетингу, культурної зацікавленості, негативних чи радикальних політичних настроїв на основі текстового аналізу та загальної емотивної оцінки використаної користувачем текстової інформації.
Це зумовлює актуальність створення системи автоматичної оцінки тональності тексту для визначення рівня тонального навантаження документу.
Мета дослідження полягає у створенні тонального словника українською мовою, розподілу слів у словнику на емоційно-насичені групи та вивченні існуючих методів обробки тексту для визначення емоційного навантаження документу; розробці веб-сервісу, що реалізує функціонал автоматизованого процесу сентимент аналізу.
Для досягнення поставленої задачі були сформовані наступні завдання дослідження, що визначили логіку дослідження та його структуру:
— провести аналіз існуючих методів визначення емоційного забарвлення текстів;
— запропонувати підходи для створення тональних словників та групування слів у емоційні групи;
— обрати та реалізувати адитивний алгоритм оцінки тональності тексту;
— розробити програмний застосунок, що втілює запропонований метод словників;
— дослідити методи стемінгу та лематизації для обробки та приведення слів тексту до початкової форми
— створити загальнодоступний веб-сервіс системи з метою надання доступу до функцій програмного застосунку;
— розробити клієнтську частину системи для доступу до користувацького інтерфейсу з метою забезпечення зручного представлення даних, отриманих під час процесу оцінки тональності тексту.
— розробити стартап-проект на основі розробленого програмного застосунку
Об’єктом дослідження: методи розпізнавання тональності тексту у контексті глибинного аналізу.
Предметом дослідження є метод словників для розпізнавання тональності текстів у розрізі лінгвістичного підходу.
Наукова новизна одержаних результатів. Найважливішим результатом магістерської роботі є створення словнику тональності слів українською мовою з розподілом словнику на окремі файли, кожен з яких відповідає певній групі настроїв, що можна доповнювати та розширювати в залежності від предметної області, з якої узято текст.
Практичне значення одержаних результатів роботи полягає у розробці системи автоматичної оцінки тональності тексту з наданням детальних статистичних даних визначеної тональності тексту, що можуть бути використані для подальшого аналізу суспільних потреб.
Опис
Ключові слова
тональний словник, лематизація, стемінг, тональна оцінка, tonal dictionary, lematism, steming, tonal evaluation
Бібліографічний опис
Гвозденко, О. В. Автоматична оцінка тональності тексту : магістерська дис. : 121 Інженерія програмного забезпечення / Гвозденко Олександра Валеріївна. – Київ, 2018. – 106 с.