Порівняльний аналіз ансамблевих алгоритмів машинного навчання у прогнозуванні наявності захворювань серця
dc.contributor.author | Беспалов, Ярослав Володимирович | |
dc.contributor.author | Настенко, Євген Арнольдович | |
dc.contributor.author | Бабенко, Віталій Олегович | |
dc.date.accessioned | 2024-03-08T06:36:34Z | |
dc.date.available | 2024-03-08T06:36:34Z | |
dc.date.issued | 2023 | |
dc.description.abstract | Реферат – Серцево-судинні захворювання (ССЗ) продовжують бути провідною причиною летальних випадків та інвалідизації на глобальному рівні, становлячи загрозу для здоров’я мільйонів осіб. Незважаючи на значні досягнення в області медичних технологій, існують виклики, пов’язані з ранньою діагностикою та точним прогнозуванням ССЗ, що ускладнюється різноманітністю клінічних даних та складністю патологій. Дане дослідження має на меті оцінити ефективність застосування ансамблевих алгоритмів машинного навчання для прогнозування ССЗ, аналізуючи їх точність, надійність та інтегрованість з клінічними даними. Особлива увага приділяється потенціалу цих алгоритмів у вдосконаленні клінічного прогнозування та терапевтичних підходів до лікування ССЗ. Науковий проект фокусується на реалізації алгоритмів машинного навчання, зокрема ансамблевих методів, які застосовуються для створення моделей бінарної класифікації. Використовуються такі методи ансамблевого навчання, як Random Forest, XGBoost та LightGBM. Основна увага зосереджена на оптимальному розподілі даних для забезпечення точної оцінки, з використанням 10% даних для екзамену, 80% для тренування та 20% для тестування. Параметри моделей оптимізуються за допомогою 5-fold перехресної валідації. Модель Random Forest продемонструвала високу точність під час тренування, однак показала меншу точність під час тестування і екзамену, що може свідчити про перенавчання. У контрасті, моделі LightGBM та XGBoost показали більш стабільні результати на всіх етапах, зокрема LightGBM виявилася більш ефективною з точки зору швидкості навчання. Висновки дослідження підтверджують, що ансамблеві алгоритми машинного навчання, особливо LightGBM, є ефективними у прогнозуванні ССЗ. Результати також акцентують увагу на тому, що вік, систолічний кров’яний тиск та індекс маси тіла є ключовими індикаторами для оцінки ризику ССЗ. | |
dc.description.abstractother | Abstract – Cardiovascular disease (CVD) continues to be the leading cause of death and disability globally, threatening the health of millions of people. Despite significant advances in medical technology, there are challenges associated with early diagnosis and accurate prognosis of CVD, which is complicated by the diversity of clinical data and the complexity of pathologies. This study aims to evaluate the effectiveness of ensemble machine learning algorithms for CVD prediction by analyzing their accuracy, reliability, and integration with clinical data. Particular attention is paid to the potential of these algorithms to improve clinical prognosis and therapeutic approaches to CVD treatment. The research project focuses on the implementation of machine learning algorithms, in particular ensemble methods used to create binary classification models. The ensemble learning methods used are Random Forest, XGBoost and LightGBM. The focus is on optimal data distribution to ensure accurate scores, using 10% of the data for the exam, 80% for training, and 20% for testing. Model parameters are optimized using 5-fold cross-validation. The Random Forest model demonstrated high accuracy during training, but showed lower accuracy during testing and the exam, which may indicate overfitting. In contrast, the LightGBM and XGBoost models showed more stable results at all stages, with LightGBM proving to be more efficient in terms of learning speed. The findings of the study confirm that ensemble machine learning algorithms, especially LightGBM, are effective in predicting CVD. The results also emphasize that age, systolic blood pressure, and body mass index are key indicators for assessing CVD risk. | |
dc.format.pagerange | Pp. 33-41 | |
dc.identifier.citation | Беспалов, В. В. Порівняльний аналіз ансамблевих алгоритмів машинного навчання у прогнозуванні наявності захворювань серця / Беспалов Ярослав Володимирович, Настенко Євген Арнольдович, Бабенко Віталій Олегович // Біомедична інженерія і технологія. – 2023. – № 12. – С. 33-41. – Бібліогр.: 16 назв. | |
dc.identifier.doi | https://doi.org/10.20535/2617-8974.2023.12.293469 | |
dc.identifier.issn | 2707-8434 | |
dc.identifier.orcid | 0009-0009-9167-592X | |
dc.identifier.orcid | 0000-0002-1076-9337 | |
dc.identifier.orcid | 0000-0002-8433-3878 | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/65338 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.relation.ispartof | Біомедична інженерія і технологія, № 12 | |
dc.subject | серцево-судинні захворювання | |
dc.subject | аналіз медичних даних | |
dc.subject | алгоритми прогнозування | |
dc.subject | машинне навчання | |
dc.subject | ансамблеве навчання | |
dc.subject | Cardiovascular Diseases | |
dc.subject | Medical Data Analysis | |
dc.subject | Prediction Algorithms | |
dc.subject | Machine Learning | |
dc.subject | Ensemble Learning | |
dc.subject.udc | 004.8 + 616.12 + 519.254.3 | |
dc.title | Порівняльний аналіз ансамблевих алгоритмів машинного навчання у прогнозуванні наявності захворювань серця | |
dc.title.alternative | A comparative analysis of ensemble machine learning algorithms for predicting the presence of cardiovascular disease | |
dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- 293469-680806-1-10-20231226.pdf
- Розмір:
- 618.14 KB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: