Intelligent system for monitoring the information space of news about artificial intelligence
| dc.contributor.author | Riabtsev, Viacheslav | |
| dc.contributor.author | Marchuk, Yurii | |
| dc.date.accessioned | 2026-02-04T09:38:56Z | |
| dc.date.available | 2026-02-04T09:38:56Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Under conditions of exponential growth in the volume of information related to the development of artificial intelligence (AI) technologies, traditional methods of monitoring the media space become ineffective. Messengers and social networks, particularly Telegram, have become key channels for distributing real-time news, generating high-intensity streams of unstructured data. The article considers the problem of creating an intelligent system for monitoring the information space that is capable of automatically structuring this chaotic data flow. The aim of this work is the design and software implementation of a platform architecture that provides a full ETL (Extract–Transform–Load) cycle: from collecting data via the Telegram API to its semantic analysis and visualization. A modular architecture is proposed that includes subsystems for asynchronous parsing, text preprocessing (NLP pipeline), and an analytical core. The study focuses primarily on the algorithmic support of the system. The use of a hybrid approach to text classification is substantiated, combining dictionary-based methods (Keyword Matching) for accurate identification of entities (for example, models GPT‑4, Gemini, LLaMA) with machine learning components for determining message sentiment. An algorithm for content deduplication is developed, which makes it possible to filter out reposts and information noise and to highlight the sources of news. The results of experimental testing of the developed system on a sample of more than 10,000 messages from thematic Telegram channels are presented. A categorization accuracy of 91% was achieved, which confirms the effectiveness of the chosen methods. The system’s capabilities in detecting trends in real time, constructing the dynamics of mentions of key technologies, and generating automated analytical reports are demonstrated. The practical value of the work lies in creating a toolkit for data researchers, analysts, and developers that significantly reduces the time required to search for relevant information and to track the AI technology landscape. | |
| dc.description.abstractother | В умовах експоненційногозростання обсягів інформації, пов’язаної з розвитком технологій штучного інтелекту (ШІ), традиційні методи моніторингу медіапростору стають неефективними. Месенджери та соціальні мережі, зокрема Telegram, трансформувалися в ключові канали розповсюдження оперативних новин, генеруючи потоки неструктурованих даних високої інтенсивності. У статті розглянуто проблему створення інтелектуальної системи моніторингу інформаційного простору, здатної в автоматичному режимі структурувати цей хаотичний потік даних.Метою роботи є проєктування та програмна реалізація архітектури платформи, що забезпечує повний цикл обробки інформації (ETL): від збору даних через Telegram API до їх семантичного аналізу та візуалізації. Запропоновано модульну архітектуру, яка включає підсистеми асинхронного парсингу, попередньої обробки тексту (NLP-пайплайн) та аналітичне ядро.Основну увагу в дослідженні приділено алгоритмічному забезпеченню системи. Обґрунтовано використання гібридного підходу до класифікації текстів, що поєднує словникові методи (Keyword Matching) для точної ідентифікації сутностей (наприклад, моделей GPT-4, Gemini, Llama) та елементи машинного навчання для визначення тональності повідомлень. Розроблено алгоритм дедуплікації контенту, який дозволяє фільтрувати репости та інформаційний шум, виокремлюючи першоджерела новин.Наведено результати експериментального тестування розробленого комплексу на вибірці з понад 10 000 повідомлень з тематичних Telegram-каналів. Досягнуто показників точності категоризації на рівні 91%, що підтверджує ефективність обраних методів. Продемонстровано можливості системи у виявленні трендів у реальному часі, побудові динаміки згадувань ключових технологій та формуванні автоматизованих аналітичних звітів. Практична цінність роботи полягає у створенні інструментарію для дослідників даних, аналітиків та розробників, який дозволяє суттєво скоротити час на пошук релевантної інформації та відстеження технологічного ландшафту ШІ. | |
| dc.format.pagerange | P. 279-289 | |
| dc.identifier.citation | Riabtsev, V. Intelligent system for monitoring the information space of news about artificial intelligence / Viacheslav Riabtsev, Yurii Marchuk // Information Technology and Security. – 2025. – Vol. 13, Iss. 2 (25). – P. 279-289. – Bibliogr.: 8 ref. | |
| dc.identifier.doi | https://doi.org/10.20535/2411-1031.2025.13.2.344713 | |
| dc.identifier.orcid | 0000-0001-8331-0132 | |
| dc.identifier.orcid | 0009-0004-3708-6108 | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/78628 | |
| dc.language.iso | en | |
| dc.publisher | Institute of Special Communication and Information Protection of National Technical University of Ukraine “Igor Sikorsky Kyiv Polytechnic Institute” | |
| dc.publisher.place | Kyiv | |
| dc.relation.ispartof | Information Technology and Security, Vol. 13, Iss. 2 (25) | |
| dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | monitoring | |
| dc.subject | social media | |
| dc.subject | content monitoring system | |
| dc.subject | natural language processing | |
| dc.subject | text classification | |
| dc.subject | artificial intelligence | |
| dc.subject | news document analysis | |
| dc.subject | моніторинг | |
| dc.subject | соціальні медіа | |
| dc.subject | система контент-моніторингу | |
| dc.subject | обробка природної мови (NLP) | |
| dc.subject | класифікація текстів | |
| dc.subject | штучний інтелект | |
| dc.subject | аналіз новинних документів | |
| dc.subject.udc | 004.8:004.912 | |
| dc.title | Intelligent system for monitoring the information space of news about artificial intelligence | |
| dc.title.alternative | Інтелектуальна система моніторингу інформаційного простору новин щодо штучного інтелекту | |
| dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: