Порівняльний аналіз ансамблевих алгоритмів машинного навчання у прогнозуванні наявності захворювань серця

Вантажиться...
Ескіз

Дата

2023

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Реферат – Серцево-судинні захворювання (ССЗ) продовжують бути провідною причиною летальних випадків та інвалідизації на глобальному рівні, становлячи загрозу для здоров’я мільйонів осіб. Незважаючи на значні досягнення в області медичних технологій, існують виклики, пов’язані з ранньою діагностикою та точним прогнозуванням ССЗ, що ускладнюється різноманітністю клінічних даних та складністю патологій. Дане дослідження має на меті оцінити ефективність застосування ансамблевих алгоритмів машинного навчання для прогнозування ССЗ, аналізуючи їх точність, надійність та інтегрованість з клінічними даними. Особлива увага приділяється потенціалу цих алгоритмів у вдосконаленні клінічного прогнозування та терапевтичних підходів до лікування ССЗ. Науковий проект фокусується на реалізації алгоритмів машинного навчання, зокрема ансамблевих методів, які застосовуються для створення моделей бінарної класифікації. Використовуються такі методи ансамблевого навчання, як Random Forest, XGBoost та LightGBM. Основна увага зосереджена на оптимальному розподілі даних для забезпечення точної оцінки, з використанням 10% даних для екзамену, 80% для тренування та 20% для тестування. Параметри моделей оптимізуються за допомогою 5-fold перехресної валідації. Модель Random Forest продемонструвала високу точність під час тренування, однак показала меншу точність під час тестування і екзамену, що може свідчити про перенавчання. У контрасті, моделі LightGBM та XGBoost показали більш стабільні результати на всіх етапах, зокрема LightGBM виявилася більш ефективною з точки зору швидкості навчання. Висновки дослідження підтверджують, що ансамблеві алгоритми машинного навчання, особливо LightGBM, є ефективними у прогнозуванні ССЗ. Результати також акцентують увагу на тому, що вік, систолічний кров’яний тиск та індекс маси тіла є ключовими індикаторами для оцінки ризику ССЗ.

Опис

Ключові слова

серцево-судинні захворювання, аналіз медичних даних, алгоритми прогнозування, машинне навчання, ансамблеве навчання, Cardiovascular Diseases, Medical Data Analysis, Prediction Algorithms, Machine Learning, Ensemble Learning

Бібліографічний опис

Беспалов, В. В. Порівняльний аналіз ансамблевих алгоритмів машинного навчання у прогнозуванні наявності захворювань серця / Беспалов Ярослав Володимирович, Настенко Євген Арнольдович, Бабенко Віталій Олегович // Біомедична інженерія і технологія. – 2023. – № 12. – С. 33-41. – Бібліогр.: 16 назв.