Intelligent system for monitoring the information space of news about artificial intelligence

dc.contributor.authorRiabtsev, Viacheslav
dc.contributor.authorMarchuk, Yurii
dc.date.accessioned2026-02-04T09:38:56Z
dc.date.available2026-02-04T09:38:56Z
dc.date.issued2025
dc.description.abstractUnder conditions of exponential growth in the volume of information related to the development of artificial intelligence (AI) technologies, traditional methods of monitoring the media space become ineffective. Messengers and social networks, particularly Telegram, have become key channels for distributing real-time news, generating high-intensity streams of unstructured data. The article considers the problem of creating an intelligent system for monitoring the information space that is capable of automatically structuring this chaotic data flow. The aim of this work is the design and software implementation of a platform architecture that provides a full ETL (Extract–Transform–Load) cycle: from collecting data via the Telegram API to its semantic analysis and visualization. A modular architecture is proposed that includes subsystems for asynchronous parsing, text preprocessing (NLP pipeline), and an analytical core. The study focuses primarily on the algorithmic support of the system. The use of a hybrid approach to text classification is substantiated, combining dictionary-based methods (Keyword Matching) for accurate identification of entities (for example, models GPT‑4, Gemini, LLaMA) with machine learning components for determining message sentiment. An algorithm for content deduplication is developed, which makes it possible to filter out reposts and information noise and to highlight the sources of news. The results of experimental testing of the developed system on a sample of more than 10,000 messages from thematic Telegram channels are presented. A categorization accuracy of 91% was achieved, which confirms the effectiveness of the chosen methods. The system’s capabilities in detecting trends in real time, constructing the dynamics of mentions of key technologies, and generating automated analytical reports are demonstrated. The practical value of the work lies in creating a toolkit for data researchers, analysts, and developers that significantly reduces the time required to search for relevant information and to track the AI technology landscape.
dc.description.abstractotherВ умовах експоненційногозростання обсягів інформації, пов’язаної з розвитком технологій штучного інтелекту (ШІ), традиційні методи моніторингу медіапростору стають неефективними. Месенджери та соціальні мережі, зокрема Telegram, трансформувалися в ключові канали розповсюдження оперативних новин, генеруючи потоки неструктурованих даних високої інтенсивності. У статті розглянуто проблему створення інтелектуальної системи моніторингу інформаційного простору, здатної в автоматичному режимі структурувати цей хаотичний потік даних.Метою роботи є проєктування та програмна реалізація архітектури платформи, що забезпечує повний цикл обробки інформації (ETL): від збору даних через Telegram API до їх семантичного аналізу та візуалізації. Запропоновано модульну архітектуру, яка включає підсистеми асинхронного парсингу, попередньої обробки тексту (NLP-пайплайн) та аналітичне ядро.Основну увагу в дослідженні приділено алгоритмічному забезпеченню системи. Обґрунтовано використання гібридного підходу до класифікації текстів, що поєднує словникові методи (Keyword Matching) для точної ідентифікації сутностей (наприклад, моделей GPT-4, Gemini, Llama) та елементи машинного навчання для визначення тональності повідомлень. Розроблено алгоритм дедуплікації контенту, який дозволяє фільтрувати репости та інформаційний шум, виокремлюючи першоджерела новин.Наведено результати експериментального тестування розробленого комплексу на вибірці з понад 10 000 повідомлень з тематичних Telegram-каналів. Досягнуто показників точності категоризації на рівні 91%, що підтверджує ефективність обраних методів. Продемонстровано можливості системи у виявленні трендів у реальному часі, побудові динаміки згадувань ключових технологій та формуванні автоматизованих аналітичних звітів. Практична цінність роботи полягає у створенні інструментарію для дослідників даних, аналітиків та розробників, який дозволяє суттєво скоротити час на пошук релевантної інформації та відстеження технологічного ландшафту ШІ.
dc.format.pagerangeP. 279-289
dc.identifier.citationRiabtsev, V. Intelligent system for monitoring the information space of news about artificial intelligence / Viacheslav Riabtsev, Yurii Marchuk // Information Technology and Security. – 2025. – Vol. 13, Iss. 2 (25). – P. 279-289. – Bibliogr.: 8 ref.
dc.identifier.doihttps://doi.org/10.20535/2411-1031.2025.13.2.344713
dc.identifier.orcid0000-0001-8331-0132
dc.identifier.orcid0009-0004-3708-6108
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/78628
dc.language.isoen
dc.publisherInstitute of Special Communication and Information Protection of National Technical University of Ukraine “Igor Sikorsky Kyiv Polytechnic Institute”
dc.publisher.placeKyiv
dc.relation.ispartofInformation Technology and Security, Vol. 13, Iss. 2 (25)
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectmonitoring
dc.subjectsocial media
dc.subjectcontent monitoring system
dc.subjectnatural language processing
dc.subjecttext classification
dc.subjectartificial intelligence
dc.subjectnews document analysis
dc.subjectмоніторинг
dc.subjectсоціальні медіа
dc.subjectсистема контент-моніторингу
dc.subjectобробка природної мови (NLP)
dc.subjectкласифікація текстів
dc.subjectштучний інтелект
dc.subjectаналіз новинних документів
dc.subject.udc004.8:004.912
dc.titleIntelligent system for monitoring the information space of news about artificial intelligence
dc.title.alternativeІнтелектуальна система моніторингу інформаційного простору новин щодо штучного інтелекту
dc.typeArticle

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
279-289.pdf
Розмір:
565.67 KB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: