Моніторинг потоку новин у мережевих медіа

dc.contributor.advisorСтативка, Юрій Іванович
dc.contributor.authorІльчишин, Данило Вікторович
dc.date.accessioned2019-03-26T16:09:48Z
dc.date.available2019-03-26T16:09:48Z
dc.date.issued2018-12
dc.description.abstractenStructure and volume of thesis The master's dissertation consists of an introduction, six sections, a conclusion, a list of references from 40 titles, 2 annexes, and contains 64 drawings, 29 tables and 19 code listings. The full volume of the master's dissertation is 85 pages, of which the list of links takes 3 pages, applications - 8 pages. Actuality of theme. The development of an automated system for monitoring the flow of news in network media is an important issue in the modern world in which the World Wide Web is the main source of media information. Large amounts of information lead to a problem of their processing and analysis of the relevance or relevance of describing a description of a topic. This determines the relevance of creating an automated network news media news analysis system to enable automatic analysis of information obtained from electronic media. The aim of the study is to analyze the existing types of representation of network media information, the choice of the format that is best suited for further analysis and research; the development of a web service that implements the function of the automated process of monitoring the flow of news network media. To accomplish the task, the following research tasks were formed that determined the logic of the research and its structure: 1. To investigate existing types of presentation of network media information and to choose the most effective format for further processing; 2. To develop and implement the process of bringing the input information into a form suitable for further processing and preservation; 3. To select and implement the algorithm of clustering of texts using the established list of stop words and the possibility of obtaining detailed information for each cluster algorithm obtained as a result of the work; 4. Design the public interface of the web service system to provide access to relevant parts of the function; 5. Develop a client-side user interface to provide a convenient representation of the data received during the processing of information received with news resources, as well as providing appropriate visual controls for interaction with the corresponding functionality of the system. The object of research is the streams of information of network media resources. The subject of the study is the algorithms of the process of monitoring and analyzing news streams in network media, in particular using the following functional:  parsing RSS feeds of selected network media;  clustering of texts of publications;  periodically collecting current media information for further analysis. Scientific novelty of the obtained results. The most significant scientific results of the master's thesis are the implementation of an integrated solution for collecting, parsing and analyzing RSS feeds of selected network media, ensuring the possibility of automatic clustering of texts of received publications into specific topics for facilitating further analysis or interpretation by the user. The practical significance of the results of the work is to develop an automated electronic system for monitoring the flow of news on the network in the network media with the provision of detailed statistical data that can be used for further analysis.uk
dc.description.abstractruИсследования заключается в анализе существующих видов представления информации сетевых СМИ, выборе формата, лучше всего подходит для выполнения дальнейшего анализа и исследований; разработке веб-сервиса, реализует функционал автоматизированного процесса мониторинга потока новостей сетевых медиаuk
dc.description.abstractukСтруктура та обсяг дипломної роботи Магістерська дисертація складається зі вступу, шести розділів, висновку, переліку посилань з 40 найменувань, 2 додатків, та містить 64 рисунки, 29 таблиць і 19 лістингів коду. Повний обсяг магістерської дисертації складає 85 сторінок, з яких перелік посилань займає 3 сторінки, додатки — 8 сторінок. Актуальність теми. Розробка автоматизованої системи моніторингу потоку новин у мережевих медіа є важливим питанням у сучасному світі, в якому всесвітня мережа Інтернет є головним джерелом медіа інформації. Великі об’ємі інформації призводять до виникнення проблеми їх обробки та аналізу актуальності або доречності стосовно опису опису тієї чи іншої теми. Це зумовлює актуальність створення автоматизованої системи аналізу потоку новин мережевих медіа для надання можливості автоматичного аналізу отриманої з електронних ЗМІ інформації. Мета дослідження полягає у аналізі існуючих видів подання інформації мережевих медіа, виборі формату, що найкраще підходить для виконання подальшого аналізу та досліджень; розробці веб-сервісу, що реалізує функціонал автоматизованого процесу моніторингу потоку новин мережевих медіа. Для досягнення поставленої задачі були сформовані наступні завдання дослідження, що визначили логіку дослідження та його структуру: 1. Дослідити існуючі види подання інформації мережевих медіа та обрати найбільш ефективний для подальшої обробки формат; 2. Розробити та реалізувати процес приведення вхідної інформації до виду, придатного для подальшої обробки та збереження; 3. Обрати та реалізувати алгоритм кластеризації текстів з використанням встановленного списку стоп-слів та можливістю отримання детальної інформації за кожним з отриманих в результаті роботи алгоритму кластеру; 4. Спроектувати публічний інтерфейс веб-сервісу системи для надання доступу до відповідних частин функціоналу; 5. Розробити клієнтський інтерфейс користувача з забезпеченням зручного представлення даних отриманих під час обробки отриманої з новинним ресурсів інформації, а також надання відповідних візуальних елементів керування для взаємодії з відповідним функціоналом системи. Об’єктом дослідження є потоки інформації мережевих медіа-ресурсів. Предметом дослідження є алгоритми процесу моніторингу та аналізу потоків новин у мережевих медіа, зокрема з використанням наступного функціоналу:  парсинг RSS-стрічок обраних мережевих ЗМІ;  кластеризація текстів публікацій;  періодичне збирання поточної інформації медіа джерел для подальшого аналізу. Наукова новизна одержаних результатів. Найбільш суттєвими науковими результатами магістерської дисертації є реалізація комплексного рішення для збору, парсингу та аналізу RSS-стрічок обраних мережевих медіа, забезпечення можливості автоматичної кластеризації текстів отриманих публікацій на визначені тематики для полегшення подальшого аналізу або інтерпретації користувачем. Практичне значення одержаних результатів роботи полягає в розробці автоматизованої електронної системи моніторингу потоку новин мережевих у мережевих медіа з наданням детальних статистичних даних, що можуть бути використані для подальшого аналізу.uk
dc.format.page90 с.uk
dc.identifier.citationІльчишин, Д. В. Моніторинг потоку новин у мережевих медіа : магістерська дис. : 121 Інженерія програмного забезпечення / Ільчишин Данило Вікторович. – Київ, 2018. – 90 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/26923
dc.language.isoukuk
dc.publisher.placeКиївuk
dc.subjectмережеві медіаuk
dc.subjectкластеризація текстівuk
dc.subjectRSSuk
dc.subjectмоніторингuk
dc.subjectnetwork mediauk
dc.subjectclassification of textsuk
dc.subjectmonitoringuk
dc.subject.udc004.422.833uk
dc.titleМоніторинг потоку новин у мережевих медіаuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
Ilchyshyn_magistr.docx
Розмір:
23.28 MB
Формат:
Microsoft Word XML
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: