Алгоритм потокової кластеризації для моніторингу та діагностики стану технічних систем реального часу

dc.contributor.authorШарадкін, Дмитро Михайлович
dc.date.accessioned2020-05-27T13:08:28Z
dc.date.available2020-05-27T13:08:28Z
dc.date.issued2018
dc.description.abstractУ роботі розглядаються особливості автоматизації процесів моніторингу та діагностики стану технічних систем реального часу, зокрема, сучасних комп’ютерних систем і мереж. Показано, що існуючі методи забезпечують вирішення задач діагностики та моніторингу з суттєвими обмеженнями, що в основному пов’язані з припущенням стаціонарності базових характеристик об’єктів моніторингу. Специфічні особливості систем, що функціонують в режимі реального часу вимагають, щоб алгоритми класифікації та кластеризації, які складають основу сучасних засобів моніторингу та діагностики, функціонували в потоковому режимі, водночас відповідаючи вимогам мінімізації обсягу задіяної пам’яті. Також ці алгоритми мають забезпечити практичну незалежність часу роботи від обсягу даних, що надходять на обробку; підтримувати роботу з кластерами відмінної від сферичної форми в просторі ознак; враховувати необхідність зберігання працездатності в умовах, коли статистичні характеристики потоку даних динамічно змінюються та при невідомій, можливо змінній, кількості кластерів у вибірці; реалізовувати процедури виявлення викидів у вхідних даних. Запропоновано алгоритм виявлення кластерної структури, що заснований на використанні відображення вхідної вибірки даних в спеціальним чином сконструйований сітковий простір, з одночасним врахуванням як характеристик щільності заповнення простору опису об’єктів, так і його метричних властивостей. Проаналізовані властивості запропонованого алгоритму і залежність його внутрішніх характеристик, що обираються при аналізі та від зовнішніх параметрів, що залежать від характеристик вибірки даних. Модифікація для випадку потокового надходження даних дозволяє адаптувати алгоритм, не вимагаючи при цьому додаткових витрат пам’яті для зберігання інформації. Для урахування динамічної зміни характеристик кластерів запропоновано використання функції забування та розглянуті можливі способи її опису. Досліджений вплив різновидів функції забування на характеристики працездатності запропонованого алгоритму. Відносна простота алгоритму і семантична прозорість його параметрів дозволяє виконувати налаштування алгоритму для різних областей застосування, включаючи задачі виявлення і запобігання інцидентам у сфері інформаційної безпеки.uk
dc.description.abstractenSpecial features of automatization of the states monitoring and diagnostics processes in technical systems which are executed in real-time mode, in particular modern computer systems and networks, are investigated and described in this paper. It is shown that the existing methods provide a solution for diagnostics and monitoring with significant limitations, which are mainly related to the stationary assumption of the basic characteristics of the objects of monitoring. The specific features of real-time systems require that the classification and clustering algorithms, which form the basis of modern monitoring and diagnostic tools, have to execute in a streaming mode, while simultaneously requirements for minimizing the amount of involved memory. These algorithms should provide practical independence of the execution time from the amount of data. They have to handling with clusters of spherical form in the feature space; to preserve the performance under conditions of dynamically changing of statistical characteristics of the data flow and with an unknown, possibly variable, number of clusters in the sample. Outliers and anomalies in data have to be detected and processed. An algorithm based on the simultaneous use of the mapping of the original data sample into a specially designed finite grid space, using both the fill density characteristics of the object description space and its metric properties for detecting the cluster structure is proposed. The properties of the algorithm and the dependence of its characteristics from the specified parameters are analysed. Some modification of the algorithm allows execute streaming data processing, easily adapt the algorithm without utilization extra memory. For handling of the clusters' parameters dynamic changes the attenuation function was introduced. Some variants of its specification were considered, their influence on proposed algorithm's performance was analyzed. The relative simplicity of the algorithm and the semantic transparency of its external parameters make it possible simple configure the algorithm for various areas of its application, including the tasks of IT-security incidents detecting and preventing in computer systems and networks.en
dc.format.extentС. 59-74uk
dc.identifier.citationШарадкін, Д. Алгоритм потокової кластеризації для моніторингу та діагностики стану технічних систем реального часу / Дмитро Шарадкін // Information Technology and Security. – 2018. – Vol. 6, Iss. 1 (10). – Pp. 59–74. – Bibliogr.: 19 ref.uk
dc.identifier.doihttps://doi.org/10.20535/2411-1031.2018.6.1.153143
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/33788
dc.language.isouken
dc.publisherInstitute of Special Communication and Information Protection of National Technical University of Ukraine “Igor Sikorsky Kyiv Polytechnic Institute”en
dc.publisher.placeKyiven
dc.relation.ispartofInformation Technology and Security : Ukrainian research papers collection, 2018, Vol. 6, Iss. 1 (10)en
dc.subjectмоніторинг та діагностика стану систем реального часуuk
dc.subjectвиявлення інцидентів інформаційної безпекиuk
dc.subjectмашинне навчанняuk
dc.subjectкласифікаціяuk
dc.subjectкластеризаціяuk
dc.subjectпотокова обробка данихuk
dc.subjectдинамічна зміна форм та положення кластерівuk
dc.subjectmonitoring and diagnostics of real-time systemsen
dc.subjectdetection of information security incidentsen
dc.subjectmachine learningen
dc.subjectclassificationen
dc.subjectclusteringen
dc.subjectstreaming data processingen
dc.subjectdynamic changes of cluster’s form and positionen
dc.subject.udc004.942:004.056.5en
dc.titleАлгоритм потокової кластеризації для моніторингу та діагностики стану технічних систем реального часуuk
dc.title.alternativeStreaming clustering algorithm for monitoring and condition's diagnostics of technical real-time systemsen
dc.typeArticleen

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
ITS2018-6-1_06.pdf
Розмір:
2.06 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.06 KB
Формат:
Item-specific license agreed upon to submission
Опис: