Algorithms of statistical anomalies clearing for data science applications
dc.contributor.author | Pysarchuk, O. | |
dc.contributor.author | Baran, D. | |
dc.contributor.author | Mironov, Yu. | |
dc.contributor.author | Pysarchuk, I. | |
dc.date.accessioned | 2023-07-13T09:26:09Z | |
dc.date.available | 2023-07-13T09:26:09Z | |
dc.date.issued | 2023 | |
dc.description.abstract | The paper considers the nature of input data used by Data Science algorithms of modern-day application domains. It then proposes three algorithms designed to remove statistical anomalies from datasets as a part of the Data Science pipeline. The main advantages of given algorithms are their relative simplicity and a small number of configurable parameters. Parameters are determined by machine learning with respect to the properties of input data. These algorithms are flexible and have no strict dependency on the nature and origin of data. The efficiency of the proposed approaches is verified with a modeling experiment conducted using algorithms implemented in Python. The results are illustrated with plots built using raw and processed datasets. The algorithms application is analyzed, and results are compared. | uk |
dc.description.abstractother | Розглянуто природу даних, що використовуються в задачах сучасних прикладних областей. Запропоновано декілька алгоритмів очищення статистичної вибірки від аномалій в конвеєрі задач Data Science. Відзнакою та перевагою запропонованих алгоритмів є їх відносна простота та обмежена кількість параметрів налаштувань, що визначаються за технологіями навчання відповідно до властивостей вхідних статистичних даних. Запропоновані алгоритми є достатньо гнучкими у використанні і не залежать від природи та походження даних. Результати модельного експерименту запропонованих підходів у вигляді скриптів мовою Python та базових бібліотек довели їх ефективність. Результати проілюстровано графіками, побудованими з використанням початкових даних та даних, що змінені за допомогою запропонованих алгоритмів. Застосування алгоритмів проаналізовано та порівняно результати виконання алгоритмів. | uk |
dc.format.pagerange | Pp. 78-84 | uk |
dc.identifier.citation | Algorithms of statistical anomalies clearing for data science applications / Pysarchuk O., Baran D., Mironov Yu., Pysarchuk I. // Системні дослідження та інформаційні технології : міжнародний науково-технічний журнал. – 2023. – № 1. – С. 78-84. – Бібліогр.: 10 назв. | uk |
dc.identifier.doi | https://doi.org/10.20535/SRIT.2308-8893.2023.1.06 | |
dc.identifier.issn | 1681–6048 | |
dc.identifier.orcid | 0000-0001-5271-0248 | uk |
dc.identifier.orcid | 0000-0002-3251-8897 | uk |
dc.identifier.orcid | 0000-0002-2291-5864 | uk |
dc.identifier.orcid | 0000-0003-4343-0142 | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/58076 | |
dc.language.iso | en | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.relation.ispartof | Системні дослідження та інформаційні технології : міжнародний науково-технічний журнал, № 1 | uk |
dc.subject | anomaly removal | uk |
dc.subject | anomaly detection | uk |
dc.subject | noise removal | uk |
dc.subject | statistical techniques | uk |
dc.subject | data analysis | uk |
dc.subject | big data | uk |
dc.subject | data cleaning | uk |
dc.subject | очищення від аномалій | uk |
dc.subject | виявлення аномалій | uk |
dc.subject | видалення шуму | uk |
dc.subject | статистичні методи | uk |
dc.subject | аналіз даних | uk |
dc.subject | великі дані | uk |
dc.subject | очищення даних | uk |
dc.subject.udc | 004.5 | uk |
dc.title | Algorithms of statistical anomalies clearing for data science applications | uk |
dc.title.alternative | Алгоритми очищення статистичної вибірки від аномалій Для задач data science | uk |
dc.type | Article | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- 260175-645054-1-10-20230520.pdf
- Розмір:
- 280.81 KB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: