Інформаційна система аналізу тональності новин на основі системного підходу

dc.contributor.advisorДанилов, Валерій Якович
dc.contributor.authorРись, Артем Андрійович
dc.date.accessioned2018-07-24T06:44:47Z
dc.date.available2018-07-24T06:44:47Z
dc.date.issued2018
dc.description.abstractenThe theme title is «Information system for tonality analysis of the text». Masterr’s thesis: 71 p., 5 fig., 23 tabl., 2 appendices and 37 sources. Object of research - semantic orientation of news. Subject of research - the Naive Bayes method and the convolutional neural network. The main goal - studying the semantic orientation of the text, using different approaches to constructing a list of features and different methods of assessing the orientation (positive, negative). A review of existing models used to build a list of features and evaluate semantic orientation was carried out, and optimal ones were selected. Methods of investigation - neural networks, methods for text processing. The main result of this study is the development of algorithms for the classification of news tones. For this purpose two methods are studied. First, it is the Naive Bayes algorithm, which uses a representative group for classification. The second one is a convolutional neural network, which consists of spinning layers, aggregation layers, fullblown layers and normalization layers. Experiments and studies of the effectiveness of two different algorithms that show positive and negative colors of the text were carried out. In addition, it is necessary to determine the algorithm that gives better results; It is still important to study how accuracy of algorithms can affect the pre-processing of data, the choice of attributes and data. The main sources of data are the Twitter platform, the expert data on the impact of news on the US economy, news headlines from the Australian news source ABC. The analysis was conducted using the Python programming language and such libraries for data analysis like pandas, sklearn, etc.uk
dc.description.abstractukМагістерська дисертація: 72 с., 5 рис., 23 табл., 2 додатки і 37 джерел. Об’єкт дослідження – семантична орієнтація текстів новин. Предмет дослідження – метод Наївного Байєса та згорткові нейронні мережі. Мета роботи – дослідження семантичної орієнтації тексту, використовуючи різні підходи до побудови списку ознак та різні методи оцінки орієнтації (позитивної, негативної). Було проведено огляд існуючих моделей, що використовуються для побудови списку ознак та оцінки семантичної орієнтації, підібрані оптимальні. Методи дослідження – нейронні мережі, методи обробки текстів. Основний результат даного дослідження – це розробка алгоритмів класифікації тональності новин. Для цього вивчаються два методи. По-перше, це алгоритм Наївного Байєсу, який використовує репрезентативну групу для класифікації. Другий - це згорткова нейронна мережа, яка складається зі згорткових шарів, агрегувальних шарів, повноз'єднаних шарів та шарів нормалізації. Були проведені експерименти та дослідження ефективності двох різних алгоритмів, що виявляють позитивні та негативні окраси тексту. Крім того, необхідно визначити алгоритм, що дає кращі результати; ще важливо вивчити, як точність алгоритмів може впливати на попередню обробку даних, вибір ознак та даних. Основними джерелами даних - є платформа Twitter, експертні дані оцінки впливу новин на економіку США, заголовки новин з Австралійського джерела новин ABC. Аналіз проводився з використанням мови програмування Python та таких бібліотек для аналізу даних, як pandas, sklearn тощо.uk
dc.format.page72 с.uk
dc.identifier.citationРись, А. А. Інформаційна система аналізу тональності новин на основі системного підходу : магістерська дис. : 124 Системний аналіз / Рись Артем Андрійович. – Київ, 2018. – 72 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/24028
dc.language.isoukuk
dc.publisher.placeКиївuk
dc.subjectсемантична орієнтація текстуuk
dc.subjectнаївний байєсuk
dc.subjectзгорткові нейронні мережіuk
dc.subjectпобудова списку ознак текстуuk
dc.subjectалгоритми класифікаціїuk
dc.subjectclassification algorithmuk
dc.subjectsemantic orientation of the textuk
dc.subjectnaive baeysuk
dc.subjectconvolutional neural networksuk
dc.subjectfeature extractionuk
dc.subject.udc004.9uk
dc.titleІнформаційна система аналізу тональності новин на основі системного підходуuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Rys_magistr.pdf
Розмір:
877.93 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
7.74 KB
Формат:
Item-specific license agreed upon to submission
Опис: