Інформаційна система виявлення аномалій в даних на основі методів машинного навчання
Дата
2024
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
Кременчуцький національний університет імені Михайла Остроградського
Анотація
У статті розглянуто інформаційну систему для виявлення аномалій у великих наборах даних з використанням методів машинного навчання. Актуальність проблеми обумовлена зростанням обсягів даних і складністю їх аналізу, що вимагає розробки автоматизованих рішень для виявлення відхилень у даних, таких як шахрайство, несправності або інші нетипові ситуації. Виявлення аномалій є важливим інструментом у таких сферах, як кібербезпека, фінансовий моніторинг, промислова діагностика та медична аналітика. Сформовано вимоги до системи виявлення аномалій за допомогою методів машинного навчання, які формалізовані у вигляді діаграми прецедентів UML, спроєктована її структура та обрані засоби розробки, створене програмне забезпечення на мові Python та проведене його тестування. Система базується на кількох алгоритмах машинного навчання, включаючи Isolation Forest, Local Outlier Factor та DBSCAN, які забезпечують ефективність і точність виявлення аномалій у різних прикладних задачах. Дослідження ефективності системи на контрольних вибірках даних показало високий рівень точності виявлення аномалій. Запропонована система дозволяє користувачам аналізувати дані та виявляти аномалії без необхідності глибоких знань у програмуванні чи налаштуванні алгоритмів. Вона автоматично проводить аналіз, порівнюючи результати роботи різних моделей, та надає можливість візуалізації результатів для покращення розуміння виявлених аномалій. Результати дослідження показали, що система здатна швидко й точно ідентифікувати аномальні дані, що дозволяє значно скоротити час аналізу та підвищити ефективність прийняття рішень. Запропоноване рішення може стати важливим інструментом для автоматизації процесів виявлення аномалій у великих наборах даних, що є критично важливим у сучасних умовах зростання обсягів інформації. Результати досліджень можуть бути використані розробниками інформаційних технологій, що працюють в області аналізу даних.
Опис
Ключові слова
виявлення аномалій, машинне навчання, інформаційна система, Local Outlier Factor, Isolation Forest, DBSCAN, аналіз даних, anomaly detection, machine learning, information system, data analysis
Бібліографічний опис
Інформаційна система виявлення аномалій в даних на основі методів машинного навчання / Олексій Шушура, Єлизавета Мороз, Ірина Сегеда, Людмила Асєєва // Вісник КрНУ імені Михайла Остроградського. – 2024. – №5(148). – С. 55-60. – Бібліогр.: 10 назв.