Алгоритм потокової кластеризації для моніторингу та діагностики стану технічних систем реального часу
dc.contributor.author | Шарадкін, Дмитро Михайлович | |
dc.date.accessioned | 2020-05-27T13:08:28Z | |
dc.date.available | 2020-05-27T13:08:28Z | |
dc.date.issued | 2018 | |
dc.description.abstract | У роботі розглядаються особливості автоматизації процесів моніторингу та діагностики стану технічних систем реального часу, зокрема, сучасних комп’ютерних систем і мереж. Показано, що існуючі методи забезпечують вирішення задач діагностики та моніторингу з суттєвими обмеженнями, що в основному пов’язані з припущенням стаціонарності базових характеристик об’єктів моніторингу. Специфічні особливості систем, що функціонують в режимі реального часу вимагають, щоб алгоритми класифікації та кластеризації, які складають основу сучасних засобів моніторингу та діагностики, функціонували в потоковому режимі, водночас відповідаючи вимогам мінімізації обсягу задіяної пам’яті. Також ці алгоритми мають забезпечити практичну незалежність часу роботи від обсягу даних, що надходять на обробку; підтримувати роботу з кластерами відмінної від сферичної форми в просторі ознак; враховувати необхідність зберігання працездатності в умовах, коли статистичні характеристики потоку даних динамічно змінюються та при невідомій, можливо змінній, кількості кластерів у вибірці; реалізовувати процедури виявлення викидів у вхідних даних. Запропоновано алгоритм виявлення кластерної структури, що заснований на використанні відображення вхідної вибірки даних в спеціальним чином сконструйований сітковий простір, з одночасним врахуванням як характеристик щільності заповнення простору опису об’єктів, так і його метричних властивостей. Проаналізовані властивості запропонованого алгоритму і залежність його внутрішніх характеристик, що обираються при аналізі та від зовнішніх параметрів, що залежать від характеристик вибірки даних. Модифікація для випадку потокового надходження даних дозволяє адаптувати алгоритм, не вимагаючи при цьому додаткових витрат пам’яті для зберігання інформації. Для урахування динамічної зміни характеристик кластерів запропоновано використання функції забування та розглянуті можливі способи її опису. Досліджений вплив різновидів функції забування на характеристики працездатності запропонованого алгоритму. Відносна простота алгоритму і семантична прозорість його параметрів дозволяє виконувати налаштування алгоритму для різних областей застосування, включаючи задачі виявлення і запобігання інцидентам у сфері інформаційної безпеки. | uk |
dc.description.abstracten | Special features of automatization of the states monitoring and diagnostics processes in technical systems which are executed in real-time mode, in particular modern computer systems and networks, are investigated and described in this paper. It is shown that the existing methods provide a solution for diagnostics and monitoring with significant limitations, which are mainly related to the stationary assumption of the basic characteristics of the objects of monitoring. The specific features of real-time systems require that the classification and clustering algorithms, which form the basis of modern monitoring and diagnostic tools, have to execute in a streaming mode, while simultaneously requirements for minimizing the amount of involved memory. These algorithms should provide practical independence of the execution time from the amount of data. They have to handling with clusters of spherical form in the feature space; to preserve the performance under conditions of dynamically changing of statistical characteristics of the data flow and with an unknown, possibly variable, number of clusters in the sample. Outliers and anomalies in data have to be detected and processed. An algorithm based on the simultaneous use of the mapping of the original data sample into a specially designed finite grid space, using both the fill density characteristics of the object description space and its metric properties for detecting the cluster structure is proposed. The properties of the algorithm and the dependence of its characteristics from the specified parameters are analysed. Some modification of the algorithm allows execute streaming data processing, easily adapt the algorithm without utilization extra memory. For handling of the clusters' parameters dynamic changes the attenuation function was introduced. Some variants of its specification were considered, their influence on proposed algorithm's performance was analyzed. The relative simplicity of the algorithm and the semantic transparency of its external parameters make it possible simple configure the algorithm for various areas of its application, including the tasks of IT-security incidents detecting and preventing in computer systems and networks. | en |
dc.format.extent | С. 59-74 | uk |
dc.identifier.citation | Шарадкін, Д. Алгоритм потокової кластеризації для моніторингу та діагностики стану технічних систем реального часу / Дмитро Шарадкін // Information Technology and Security. – 2018. – Vol. 6, Iss. 1 (10). – Pp. 59–74. – Bibliogr.: 19 ref. | uk |
dc.identifier.doi | https://doi.org/10.20535/2411-1031.2018.6.1.153143 | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/33788 | |
dc.language.iso | uk | en |
dc.publisher | Institute of Special Communication and Information Protection of National Technical University of Ukraine “Igor Sikorsky Kyiv Polytechnic Institute” | en |
dc.publisher.place | Kyiv | en |
dc.relation.ispartof | Information Technology and Security : Ukrainian research papers collection, 2018, Vol. 6, Iss. 1 (10) | en |
dc.subject | моніторинг та діагностика стану систем реального часу | uk |
dc.subject | виявлення інцидентів інформаційної безпеки | uk |
dc.subject | машинне навчання | uk |
dc.subject | класифікація | uk |
dc.subject | кластеризація | uk |
dc.subject | потокова обробка даних | uk |
dc.subject | динамічна зміна форм та положення кластерів | uk |
dc.subject | monitoring and diagnostics of real-time systems | en |
dc.subject | detection of information security incidents | en |
dc.subject | machine learning | en |
dc.subject | classification | en |
dc.subject | clustering | en |
dc.subject | streaming data processing | en |
dc.subject | dynamic changes of cluster’s form and position | en |
dc.subject.udc | 004.942:004.056.5 | en |
dc.title | Алгоритм потокової кластеризації для моніторингу та діагностики стану технічних систем реального часу | uk |
dc.title.alternative | Streaming clustering algorithm for monitoring and condition's diagnostics of technical real-time systems | en |
dc.type | Article | en |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- ITS2018-6-1_06.pdf
- Розмір:
- 2.06 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.06 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: