Інформаційна система виявлення аномалій в даних на основі методів машинного навчання

dc.contributor.authorШушура, Олексій
dc.contributor.authorМороз, Єлизавета
dc.contributor.authorСегеда, Ірина
dc.contributor.authorАсєєва, Людмила
dc.date.accessioned2025-12-03T13:16:41Z
dc.date.available2025-12-03T13:16:41Z
dc.date.issued2024
dc.description.abstractУ статті розглянуто інформаційну систему для виявлення аномалій у великих наборах даних з використанням методів машинного навчання. Актуальність проблеми обумовлена зростанням обсягів даних і складністю їх аналізу, що вимагає розробки автоматизованих рішень для виявлення відхилень у даних, таких як шахрайство, несправності або інші нетипові ситуації. Виявлення аномалій є важливим інструментом у таких сферах, як кібербезпека, фінансовий моніторинг, промислова діагностика та медична аналітика. Сформовано вимоги до системи виявлення аномалій за допомогою методів машинного навчання, які формалізовані у вигляді діаграми прецедентів UML, спроєктована її структура та обрані засоби розробки, створене програмне забезпечення на мові Python та проведене його тестування. Система базується на кількох алгоритмах машинного навчання, включаючи Isolation Forest, Local Outlier Factor та DBSCAN, які забезпечують ефективність і точність виявлення аномалій у різних прикладних задачах. Дослідження ефективності системи на контрольних вибірках даних показало високий рівень точності виявлення аномалій. Запропонована система дозволяє користувачам аналізувати дані та виявляти аномалії без необхідності глибоких знань у програмуванні чи налаштуванні алгоритмів. Вона автоматично проводить аналіз, порівнюючи результати роботи різних моделей, та надає можливість візуалізації результатів для покращення розуміння виявлених аномалій. Результати дослідження показали, що система здатна швидко й точно ідентифікувати аномальні дані, що дозволяє значно скоротити час аналізу та підвищити ефективність прийняття рішень. Запропоноване рішення може стати важливим інструментом для автоматизації процесів виявлення аномалій у великих наборах даних, що є критично важливим у сучасних умовах зростання обсягів інформації. Результати досліджень можуть бути використані розробниками інформаційних технологій, що працюють в області аналізу даних.
dc.description.abstractotherThe article discusses an information system for anomaly detection in large datasets using machine learning methods. The relevance of the problem is determined by the growing volumes of data and the complexity of their analysis, which necessitates the development of automated solutions for identifying deviations in data, such as fraud, malfunctions, or other atypical situations. Anomaly detection is a crucial tool in areas such as cybersecurity, financial monitoring, industrial diagnostics, and medical analytics. Requirements for the anomaly detection system using machine learning methods have been formulated, which are formalized in the form of a UML use case diagram. Its structure has been designed, development tools selected, software developed in Python, and testing conducted. The system is based on several machine learning algorithms, including Isolation Forest, Local Outlier Factor, and DBSCAN, which ensure the effectiveness and accuracy of anomaly detection in various application tasks. The effectiveness of the system tested on benchmark datasets showed a high level of accuracy in detecting anomalies. The proposed system allows users to analyze data and detect anomalies without the need for deep knowledge in programming or algorithm configuration. It automatically performs analysis by comparing the results of different models and provides visualization options for better understanding of the detected anomalies. The results of the study demonstrated that the system can quickly and accurately identify anomalous data, significantly reducing analysis time and enhancing decision-making efficiency. The proposed solution can become an important tool for automating anomaly detection processes in large datasets, which is critically important in the modern context of increasing information volumes. The findings can be utilized by information technology developers working in the field of data analysis.
dc.format.pagerangeС. 55-60
dc.identifier.citationІнформаційна система виявлення аномалій в даних на основі методів машинного навчання / Олексій Шушура, Єлизавета Мороз, Ірина Сегеда, Людмила Асєєва // Вісник КрНУ імені Михайла Остроградського. – 2024. – №5(148). – С. 55-60. – Бібліогр.: 10 назв.
dc.identifier.doihttps://doi.org/10.32782/1995-0519.2024.5.7
dc.identifier.orcid0000-0003-3200-720X
dc.identifier.orcid0009-0006-8865-4173
dc.identifier.orcid0000-0003-1958-4985
dc.identifier.orcid0000-0001-5954-4211
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/77501
dc.language.isouk
dc.publisherКременчуцький національний університет імені Михайла Остроградського
dc.publisher.placeКременчук
dc.relation.ispartofВісник КрНУ імені Михайла Остроградського, Випуск 5  (148), 2024
dc.subjectвиявлення аномалій
dc.subjectмашинне навчання
dc.subjectінформаційна система
dc.subjectLocal Outlier Factor
dc.subjectIsolation Forest
dc.subjectDBSCAN
dc.subjectаналіз даних
dc.subjectanomaly detection
dc.subjectmachine learning
dc.subjectinformation system
dc.subjectdata analysis
dc.subject.udc004.8:004.932
dc.titleІнформаційна система виявлення аномалій в даних на основі методів машинного навчання
dc.title.alternativeInformation system for anomaly detection in data based on machine learning methods
dc.typeArticle

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Stattia_9.pdf
Розмір:
381.73 KB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис:

Зібрання