Порівняльний аналіз ансамблевих алгоритмів машинного навчання у прогнозуванні наявності захворювань серця

dc.contributor.authorБеспалов, Ярослав Володимирович
dc.contributor.authorНастенко, Євген Арнольдович
dc.contributor.authorБабенко, Віталій Олегович
dc.date.accessioned2024-03-08T06:36:34Z
dc.date.available2024-03-08T06:36:34Z
dc.date.issued2023
dc.description.abstractРеферат – Серцево-судинні захворювання (ССЗ) продовжують бути провідною причиною летальних випадків та інвалідизації на глобальному рівні, становлячи загрозу для здоров’я мільйонів осіб. Незважаючи на значні досягнення в області медичних технологій, існують виклики, пов’язані з ранньою діагностикою та точним прогнозуванням ССЗ, що ускладнюється різноманітністю клінічних даних та складністю патологій. Дане дослідження має на меті оцінити ефективність застосування ансамблевих алгоритмів машинного навчання для прогнозування ССЗ, аналізуючи їх точність, надійність та інтегрованість з клінічними даними. Особлива увага приділяється потенціалу цих алгоритмів у вдосконаленні клінічного прогнозування та терапевтичних підходів до лікування ССЗ. Науковий проект фокусується на реалізації алгоритмів машинного навчання, зокрема ансамблевих методів, які застосовуються для створення моделей бінарної класифікації. Використовуються такі методи ансамблевого навчання, як Random Forest, XGBoost та LightGBM. Основна увага зосереджена на оптимальному розподілі даних для забезпечення точної оцінки, з використанням 10% даних для екзамену, 80% для тренування та 20% для тестування. Параметри моделей оптимізуються за допомогою 5-fold перехресної валідації. Модель Random Forest продемонструвала високу точність під час тренування, однак показала меншу точність під час тестування і екзамену, що може свідчити про перенавчання. У контрасті, моделі LightGBM та XGBoost показали більш стабільні результати на всіх етапах, зокрема LightGBM виявилася більш ефективною з точки зору швидкості навчання. Висновки дослідження підтверджують, що ансамблеві алгоритми машинного навчання, особливо LightGBM, є ефективними у прогнозуванні ССЗ. Результати також акцентують увагу на тому, що вік, систолічний кров’яний тиск та індекс маси тіла є ключовими індикаторами для оцінки ризику ССЗ.
dc.description.abstractotherAbstract – Cardiovascular disease (CVD) continues to be the leading cause of death and disability globally, threatening the health of millions of people. Despite significant advances in medical technology, there are challenges associated with early diagnosis and accurate prognosis of CVD, which is complicated by the diversity of clinical data and the complexity of pathologies. This study aims to evaluate the effectiveness of ensemble machine learning algorithms for CVD prediction by analyzing their accuracy, reliability, and integration with clinical data. Particular attention is paid to the potential of these algorithms to improve clinical prognosis and therapeutic approaches to CVD treatment. The research project focuses on the implementation of machine learning algorithms, in particular ensemble methods used to create binary classification models. The ensemble learning methods used are Random Forest, XGBoost and LightGBM. The focus is on optimal data distribution to ensure accurate scores, using 10% of the data for the exam, 80% for training, and 20% for testing. Model parameters are optimized using 5-fold cross-validation. The Random Forest model demonstrated high accuracy during training, but showed lower accuracy during testing and the exam, which may indicate overfitting. In contrast, the LightGBM and XGBoost models showed more stable results at all stages, with LightGBM proving to be more efficient in terms of learning speed. The findings of the study confirm that ensemble machine learning algorithms, especially LightGBM, are effective in predicting CVD. The results also emphasize that age, systolic blood pressure, and body mass index are key indicators for assessing CVD risk.
dc.format.pagerangePp. 33-41
dc.identifier.citationБеспалов, В. В. Порівняльний аналіз ансамблевих алгоритмів машинного навчання у прогнозуванні наявності захворювань серця / Беспалов Ярослав Володимирович, Настенко Євген Арнольдович, Бабенко Віталій Олегович // Біомедична інженерія і технологія. – 2023. – № 12. – С. 33-41. – Бібліогр.: 16 назв.
dc.identifier.doihttps://doi.org/10.20535/2617-8974.2023.12.293469
dc.identifier.issn2707-8434
dc.identifier.orcid0009-0009-9167-592X
dc.identifier.orcid0000-0002-1076-9337
dc.identifier.orcid0000-0002-8433-3878
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/65338
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.relation.ispartofБіомедична інженерія і технологія, № 12
dc.subjectсерцево-судинні захворювання
dc.subjectаналіз медичних даних
dc.subjectалгоритми прогнозування
dc.subjectмашинне навчання
dc.subjectансамблеве навчання
dc.subjectCardiovascular Diseases
dc.subjectMedical Data Analysis
dc.subjectPrediction Algorithms
dc.subjectMachine Learning
dc.subjectEnsemble Learning
dc.subject.udc004.8 + 616.12 + 519.254.3
dc.titleПорівняльний аналіз ансамблевих алгоритмів машинного навчання у прогнозуванні наявності захворювань серця
dc.title.alternativeA comparative analysis of ensemble machine learning algorithms for predicting the presence of cardiovascular disease
dc.typeArticle

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
293469-680806-1-10-20231226.pdf
Розмір:
618.14 KB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: