Алгоритм потокової кластеризації для моніторингу та діагностики стану технічних систем реального часу

Вантажиться...
Ескіз

Дата

2018

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

Institute of Special Communication and Information Protection of National Technical University of Ukraine “Igor Sikorsky Kyiv Polytechnic Institute”

Анотація

У роботі розглядаються особливості автоматизації процесів моніторингу та діагностики стану технічних систем реального часу, зокрема, сучасних комп’ютерних систем і мереж. Показано, що існуючі методи забезпечують вирішення задач діагностики та моніторингу з суттєвими обмеженнями, що в основному пов’язані з припущенням стаціонарності базових характеристик об’єктів моніторингу. Специфічні особливості систем, що функціонують в режимі реального часу вимагають, щоб алгоритми класифікації та кластеризації, які складають основу сучасних засобів моніторингу та діагностики, функціонували в потоковому режимі, водночас відповідаючи вимогам мінімізації обсягу задіяної пам’яті. Також ці алгоритми мають забезпечити практичну незалежність часу роботи від обсягу даних, що надходять на обробку; підтримувати роботу з кластерами відмінної від сферичної форми в просторі ознак; враховувати необхідність зберігання працездатності в умовах, коли статистичні характеристики потоку даних динамічно змінюються та при невідомій, можливо змінній, кількості кластерів у вибірці; реалізовувати процедури виявлення викидів у вхідних даних. Запропоновано алгоритм виявлення кластерної структури, що заснований на використанні відображення вхідної вибірки даних в спеціальним чином сконструйований сітковий простір, з одночасним врахуванням як характеристик щільності заповнення простору опису об’єктів, так і його метричних властивостей. Проаналізовані властивості запропонованого алгоритму і залежність його внутрішніх характеристик, що обираються при аналізі та від зовнішніх параметрів, що залежать від характеристик вибірки даних. Модифікація для випадку потокового надходження даних дозволяє адаптувати алгоритм, не вимагаючи при цьому додаткових витрат пам’яті для зберігання інформації. Для урахування динамічної зміни характеристик кластерів запропоновано використання функції забування та розглянуті можливі способи її опису. Досліджений вплив різновидів функції забування на характеристики працездатності запропонованого алгоритму. Відносна простота алгоритму і семантична прозорість його параметрів дозволяє виконувати налаштування алгоритму для різних областей застосування, включаючи задачі виявлення і запобігання інцидентам у сфері інформаційної безпеки.

Опис

Ключові слова

моніторинг та діагностика стану систем реального часу, виявлення інцидентів інформаційної безпеки, машинне навчання, класифікація, кластеризація, потокова обробка даних, динамічна зміна форм та положення кластерів, monitoring and diagnostics of real-time systems, detection of information security incidents, machine learning, classification, clustering, streaming data processing, dynamic changes of cluster’s form and position

Бібліографічний опис

Шарадкін, Д. Алгоритм потокової кластеризації для моніторингу та діагностики стану технічних систем реального часу / Дмитро Шарадкін // Information Technology and Security. – 2018. – Vol. 6, Iss. 1 (10). – Pp. 59–74. – Bibliogr.: 19 ref.