Автоматична оцінка тональності тексту

dc.contributor.advisorСтативка, Юрій Іванович
dc.contributor.authorГвозденко, Олександра Валеріївна
dc.date.accessioned2019-03-26T14:46:52Z
dc.date.available2019-03-26T14:46:52Z
dc.date.issued2018-12
dc.description.abstractenStructure and volume of thesis The master's dissertation consists of an introduction, six sections, a conclusion, a list of references from 32 titles, 2 applications, and contains 44 figures and 14 tables. The full volume of the master's thesis is 104 pages, of which the list of links takes 3 pages, applications - 12 pages. Actuality of theme. The emotional burden of people's opinions in society is a very important aspect when processing large volumes of information in order to identify consumer needs in the field of marketing, cultural interest, negative or radical political sentiment based on textual analysis and overall emotional evaluation of text information used by the user. This determines the relevance of creating a system for automatically evaluating the tonality of the text to determine the level of tonal load of the document. The aim of the study is to create a tonal dictionary in Ukrainian, the distribution of words in the dictionary to emotionally-saturated groups and the study of existing methods of text processing to determine the emotional load of the document; developing a web-service that implements the functional of the automated process of sentiment analysis. To accomplish the task, the following research tasks were formed that determined the logic of the research and its structure: - to analyze the existing methods of determining the emotional color of texts; - to propose approaches for creating tonal dictionaries and grouping words into emotional groups; - to select and implement an additive algorithm for assessing the tonality of the text; - develop a software application embodying the proposed method of dictionaries; - to study the methods of stigma and lematization for processing and bringing the words of the text to the original form - create a public web service system to provide access to the functions of a software application; - вevelop a client part of the system for access to the user interface in order to provide a convenient representation of the data obtained during the evaluation of the tonality of the text. - develop a startup project based on a developed software application. The object of research is a methods of recognition of the tonality of the text in the context of the deep analysis. The subject of the study is the dictionaries method for recognizing the tone of texts in the context of the linguistic approach; Scientific novelty of the obtained results. The most important result of the master's thesis is to create a vocabulary of the vocabulary of words in the Ukrainian language with the distribution of the dictionary into separate files, each of which corresponds to a certain group of sentiments that can be supplemented and expanded depending on the subject area from which the text is taken. The practical significance of the the results of the work is to develop a system of automatic evaluation of the tonality of the text with the provision of detailed statistical data of a certain tonality of the text, which can be used for further analysis of social needs.uk
dc.description.abstractruИсследования заключается в создании тонального словаря на украинском языке, распределения слов в словаре на эмоционально-насыщенные группы и изучении существующих методов обработки текста для определения эмоциональной нагрузки документа; разработке веб-сервиса, реализует функционал автоматизированного процесса сентимент анализаuk
dc.description.abstractukСтруктура та обсяг дипломної роботи Магістерська дисертація складається зі вступу, шести розділів, висновку, переліку посилань з 32 найменувань, 2 додатків, та містить 44 рисунки і 14 таблиць. Повний обсяг магістерської дисертації складає 104 сторінок, з яких перелік посилань займає 3 сторінки, додатки — 12 сторінок. Актуальність теми. Емотивне навантаження думок людей у суспільстві є дуже важливим аспектом під час обробки великих обсягів інформації з метою виявлення споживацьких потреб у сфері маркетингу, культурної зацікавленості, негативних чи радикальних політичних настроїв на основі текстового аналізу та загальної емотивної оцінки використаної користувачем текстової інформації. Це зумовлює актуальність створення системи автоматичної оцінки тональності тексту для визначення рівня тонального навантаження документу. Мета дослідження полягає у створенні тонального словника українською мовою, розподілу слів у словнику на емоційно-насичені групи та вивченні існуючих методів обробки тексту для визначення емоційного навантаження документу; розробці веб-сервісу, що реалізує функціонал автоматизованого процесу сентимент аналізу. Для досягнення поставленої задачі були сформовані наступні завдання дослідження, що визначили логіку дослідження та його структуру: — провести аналіз існуючих методів визначення емоційного забарвлення текстів; — запропонувати підходи для створення тональних словників та групування слів у емоційні групи; — обрати та реалізувати адитивний алгоритм оцінки тональності тексту; — розробити програмний застосунок, що втілює запропонований метод словників; — дослідити методи стемінгу та лематизації для обробки та приведення слів тексту до початкової форми — створити загальнодоступний веб-сервіс системи з метою надання доступу до функцій програмного застосунку; — розробити клієнтську частину системи для доступу до користувацького інтерфейсу з метою забезпечення зручного представлення даних, отриманих під час процесу оцінки тональності тексту. — розробити стартап-проект на основі розробленого програмного застосунку Об’єктом дослідження: методи розпізнавання тональності тексту у контексті глибинного аналізу. Предметом дослідження є метод словників для розпізнавання тональності текстів у розрізі лінгвістичного підходу. Наукова новизна одержаних результатів. Найважливішим результатом магістерської роботі є створення словнику тональності слів українською мовою з розподілом словнику на окремі файли, кожен з яких відповідає певній групі настроїв, що можна доповнювати та розширювати в залежності від предметної області, з якої узято текст. Практичне значення одержаних результатів роботи полягає у розробці системи автоматичної оцінки тональності тексту з наданням детальних статистичних даних визначеної тональності тексту, що можуть бути використані для подальшого аналізу суспільних потреб.uk
dc.format.page106 с.uk
dc.identifier.citationГвозденко, О. В. Автоматична оцінка тональності тексту : магістерська дис. : 121 Інженерія програмного забезпечення / Гвозденко Олександра Валеріївна. – Київ, 2018. – 106 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/26915
dc.language.isoukuk
dc.publisher.placeКиївuk
dc.subjectтональний словникuk
dc.subjectлематизаціяuk
dc.subjectстемінгuk
dc.subjectтональна оцінкаuk
dc.subjecttonal dictionaryuk
dc.subjectlematismuk
dc.subjectsteminguk
dc.subjecttonal evaluationuk
dc.subject.udc004.422.833uk
dc.titleАвтоматична оцінка тональності текстуuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
Hvozdenko_magistr.docx
Розмір:
5.55 MB
Формат:
Microsoft Word XML
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: