Порівняльний аналіз ансамблевих алгоритмів машинного навчання у прогнозуванні наявності захворювань серця

Беспалов, Ярослав Володимирович; Настенко, Євген Арнольдович; Бабенко, Віталій Олегович

Порівняльний аналіз ансамблевих алгоритмів машинного навчання у прогнозуванні наявності захворювань серця

dc.contributor.author	Беспалов, Ярослав Володимирович
dc.contributor.author	Настенко, Євген Арнольдович
dc.contributor.author	Бабенко, Віталій Олегович
dc.date.accessioned	2024-03-08T06:36:34Z
dc.date.available	2024-03-08T06:36:34Z
dc.date.issued	2023
dc.description.abstract	Реферат – Серцево-судинні захворювання (ССЗ) продовжують бути провідною причиною летальних випадків та інвалідизації на глобальному рівні, становлячи загрозу для здоров’я мільйонів осіб. Незважаючи на значні досягнення в області медичних технологій, існують виклики, пов’язані з ранньою діагностикою та точним прогнозуванням ССЗ, що ускладнюється різноманітністю клінічних даних та складністю патологій. Дане дослідження має на меті оцінити ефективність застосування ансамблевих алгоритмів машинного навчання для прогнозування ССЗ, аналізуючи їх точність, надійність та інтегрованість з клінічними даними. Особлива увага приділяється потенціалу цих алгоритмів у вдосконаленні клінічного прогнозування та терапевтичних підходів до лікування ССЗ. Науковий проект фокусується на реалізації алгоритмів машинного навчання, зокрема ансамблевих методів, які застосовуються для створення моделей бінарної класифікації. Використовуються такі методи ансамблевого навчання, як Random Forest, XGBoost та LightGBM. Основна увага зосереджена на оптимальному розподілі даних для забезпечення точної оцінки, з використанням 10% даних для екзамену, 80% для тренування та 20% для тестування. Параметри моделей оптимізуються за допомогою 5-fold перехресної валідації. Модель Random Forest продемонструвала високу точність під час тренування, однак показала меншу точність під час тестування і екзамену, що може свідчити про перенавчання. У контрасті, моделі LightGBM та XGBoost показали більш стабільні результати на всіх етапах, зокрема LightGBM виявилася більш ефективною з точки зору швидкості навчання. Висновки дослідження підтверджують, що ансамблеві алгоритми машинного навчання, особливо LightGBM, є ефективними у прогнозуванні ССЗ. Результати також акцентують увагу на тому, що вік, систолічний кров’яний тиск та індекс маси тіла є ключовими індикаторами для оцінки ризику ССЗ.
dc.description.abstractother	Abstract – Cardiovascular disease (CVD) continues to be the leading cause of death and disability globally, threatening the health of millions of people. Despite significant advances in medical technology, there are challenges associated with early diagnosis and accurate prognosis of CVD, which is complicated by the diversity of clinical data and the complexity of pathologies. This study aims to evaluate the effectiveness of ensemble machine learning algorithms for CVD prediction by analyzing their accuracy, reliability, and integration with clinical data. Particular attention is paid to the potential of these algorithms to improve clinical prognosis and therapeutic approaches to CVD treatment. The research project focuses on the implementation of machine learning algorithms, in particular ensemble methods used to create binary classification models. The ensemble learning methods used are Random Forest, XGBoost and LightGBM. The focus is on optimal data distribution to ensure accurate scores, using 10% of the data for the exam, 80% for training, and 20% for testing. Model parameters are optimized using 5-fold cross-validation. The Random Forest model demonstrated high accuracy during training, but showed lower accuracy during testing and the exam, which may indicate overfitting. In contrast, the LightGBM and XGBoost models showed more stable results at all stages, with LightGBM proving to be more efficient in terms of learning speed. The findings of the study confirm that ensemble machine learning algorithms, especially LightGBM, are effective in predicting CVD. The results also emphasize that age, systolic blood pressure, and body mass index are key indicators for assessing CVD risk.
dc.format.pagerange	Pp. 33-41
dc.identifier.citation	Беспалов, В. В. Порівняльний аналіз ансамблевих алгоритмів машинного навчання у прогнозуванні наявності захворювань серця / Беспалов Ярослав Володимирович, Настенко Євген Арнольдович, Бабенко Віталій Олегович // Біомедична інженерія і технологія. – 2023. – № 12. – С. 33-41. – Бібліогр.: 16 назв.
dc.identifier.doi	https://doi.org/10.20535/2617-8974.2023.12.293469
dc.identifier.issn	2707-8434
dc.identifier.orcid	0009-0009-9167-592X
dc.identifier.orcid	0000-0002-1076-9337
dc.identifier.orcid	0000-0002-8433-3878
dc.identifier.uri	https://ela.kpi.ua/handle/123456789/65338
dc.language.iso	uk
dc.publisher	КПІ ім. Ігоря Сікорського
dc.publisher.place	Київ
dc.relation.ispartof	Біомедична інженерія і технологія, № 12
dc.subject	серцево-судинні захворювання
dc.subject	аналіз медичних даних
dc.subject	алгоритми прогнозування
dc.subject	машинне навчання
dc.subject	ансамблеве навчання
dc.subject	Cardiovascular Diseases
dc.subject	Medical Data Analysis
dc.subject	Prediction Algorithms
dc.subject	Machine Learning
dc.subject	Ensemble Learning
dc.subject.udc	004.8 + 616.12 + 519.254.3
dc.title	Порівняльний аналіз ансамблевих алгоритмів машинного навчання у прогнозуванні наявності захворювань серця
dc.title.alternative	A comparative analysis of ensemble machine learning algorithms for predicting the presence of cardiovascular disease
dc.type	Article

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: 293469-680806-1-10-20231226.pdf
Розмір:: 618.14 KB
Формат:: Adobe Portable Document Format

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 8.98 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Біомедична інженерія і технологія, № 12