Інформаційна система виявлення аномалій в даних на основі методів машинного навчання

Шушура, Олексій; Мороз, Єлизавета; Сегеда, Ірина; Асєєва, Людмила

Інформаційна система виявлення аномалій в даних на основі методів машинного навчання

dc.contributor.author	Шушура, Олексій
dc.contributor.author	Мороз, Єлизавета
dc.contributor.author	Сегеда, Ірина
dc.contributor.author	Асєєва, Людмила
dc.date.accessioned	2025-12-03T13:16:41Z
dc.date.available	2025-12-03T13:16:41Z
dc.date.issued	2024
dc.description.abstract	У статті розглянуто інформаційну систему для виявлення аномалій у великих наборах даних з використанням методів машинного навчання. Актуальність проблеми обумовлена зростанням обсягів даних і складністю їх аналізу, що вимагає розробки автоматизованих рішень для виявлення відхилень у даних, таких як шахрайство, несправності або інші нетипові ситуації. Виявлення аномалій є важливим інструментом у таких сферах, як кібербезпека, фінансовий моніторинг, промислова діагностика та медична аналітика. Сформовано вимоги до системи виявлення аномалій за допомогою методів машинного навчання, які формалізовані у вигляді діаграми прецедентів UML, спроєктована її структура та обрані засоби розробки, створене програмне забезпечення на мові Python та проведене його тестування. Система базується на кількох алгоритмах машинного навчання, включаючи Isolation Forest, Local Outlier Factor та DBSCAN, які забезпечують ефективність і точність виявлення аномалій у різних прикладних задачах. Дослідження ефективності системи на контрольних вибірках даних показало високий рівень точності виявлення аномалій. Запропонована система дозволяє користувачам аналізувати дані та виявляти аномалії без необхідності глибоких знань у програмуванні чи налаштуванні алгоритмів. Вона автоматично проводить аналіз, порівнюючи результати роботи різних моделей, та надає можливість візуалізації результатів для покращення розуміння виявлених аномалій. Результати дослідження показали, що система здатна швидко й точно ідентифікувати аномальні дані, що дозволяє значно скоротити час аналізу та підвищити ефективність прийняття рішень. Запропоноване рішення може стати важливим інструментом для автоматизації процесів виявлення аномалій у великих наборах даних, що є критично важливим у сучасних умовах зростання обсягів інформації. Результати досліджень можуть бути використані розробниками інформаційних технологій, що працюють в області аналізу даних.
dc.description.abstractother	The article discusses an information system for anomaly detection in large datasets using machine learning methods. The relevance of the problem is determined by the growing volumes of data and the complexity of their analysis, which necessitates the development of automated solutions for identifying deviations in data, such as fraud, malfunctions, or other atypical situations. Anomaly detection is a crucial tool in areas such as cybersecurity, financial monitoring, industrial diagnostics, and medical analytics. Requirements for the anomaly detection system using machine learning methods have been formulated, which are formalized in the form of a UML use case diagram. Its structure has been designed, development tools selected, software developed in Python, and testing conducted. The system is based on several machine learning algorithms, including Isolation Forest, Local Outlier Factor, and DBSCAN, which ensure the effectiveness and accuracy of anomaly detection in various application tasks. The effectiveness of the system tested on benchmark datasets showed a high level of accuracy in detecting anomalies. The proposed system allows users to analyze data and detect anomalies without the need for deep knowledge in programming or algorithm configuration. It automatically performs analysis by comparing the results of different models and provides visualization options for better understanding of the detected anomalies. The results of the study demonstrated that the system can quickly and accurately identify anomalous data, significantly reducing analysis time and enhancing decision-making efficiency. The proposed solution can become an important tool for automating anomaly detection processes in large datasets, which is critically important in the modern context of increasing information volumes. The findings can be utilized by information technology developers working in the field of data analysis.
dc.format.pagerange	С. 55-60
dc.identifier.citation	Інформаційна система виявлення аномалій в даних на основі методів машинного навчання / Олексій Шушура, Єлизавета Мороз, Ірина Сегеда, Людмила Асєєва // Вісник КрНУ імені Михайла Остроградського. – 2024. – №5(148). – С. 55-60. – Бібліогр.: 10 назв.
dc.identifier.doi	https://doi.org/10.32782/1995-0519.2024.5.7
dc.identifier.orcid	0000-0003-3200-720X
dc.identifier.orcid	0009-0006-8865-4173
dc.identifier.orcid	0000-0003-1958-4985
dc.identifier.orcid	0000-0001-5954-4211
dc.identifier.uri	https://ela.kpi.ua/handle/123456789/77501
dc.language.iso	uk
dc.publisher	Кременчуцький національний університет імені Михайла Остроградського
dc.publisher.place	Кременчук
dc.relation.ispartof	Вісник КрНУ імені Михайла Остроградського, Випуск 5 (148), 2024
dc.subject	виявлення аномалій
dc.subject	машинне навчання
dc.subject	інформаційна система
dc.subject	Local Outlier Factor
dc.subject	Isolation Forest
dc.subject	DBSCAN
dc.subject	аналіз даних
dc.subject	anomaly detection
dc.subject	machine learning
dc.subject	information system
dc.subject	data analysis
dc.subject.udc	004.8:004.932
dc.title	Інформаційна система виявлення аномалій в даних на основі методів машинного навчання
dc.title.alternative	Information system for anomaly detection in data based on machine learning methods
dc.type	Article

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: Stattia_9.pdf
Розмір:: 381.73 KB
Формат:: Adobe Portable Document Format

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 8.98 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Статті (ЦТЕ)