Технологія ієрархічної класифікації в задачах діагностики патологій за медичними зображеннями різних модальностей

dc.contributor.advisorНастенко, Євген Арнольдович
dc.contributor.authorБабенко, Віталій Олегович
dc.date.accessioned2025-07-07T11:53:50Z
dc.date.available2025-07-07T11:53:50Z
dc.date.issued2025
dc.description.abstractБабенко В.О. Технологія ієрархічної класифікації в задачах діагностики патологій за медичними зображеннями різних модальностей. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 122 – «Комп’ютерні науки». – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2025. Дисертаційна робота складається зі вступу, чотирьох розділів, висновків, списку використаних джерел і додатків, має загальний обсяг 155 сторінок. У роботі наведено 18 рисунків, 25 таблиць. Список використаних джерел налічує 117 найменувань, з яких 16 – кирилицею та 101 – латиницею. Додаток А містить перелік публікацій та дані про апробацію результатів дисертації на 3 сторінках, а в додатку Б подано відомості про акти впровадження на 5 сторінках. Об'єкт дослідження. Аналіз діагностичних зображень. Ціль роботи. Вдосконалення методів класифікації для підвищення точності виявлення патологій за цифровими зображеннями. Методи дослідження. У рамках дослідження використано методи гістограмної обробки, просторової фільтрації, сегментації згортковими нейронними мережами, текстурного аналізу (зокрема, статистики першого порядку, GLCM, GLDS, GLRLM, NGTDM, SFM, метод енергії текстури Лоу, фрактальний аналіз, LBP, ознаки на основі гістограм, багаторегіональних гістограм, вейвлет-перетворень та згорткових нейронних мереж), кореляційний аналіз, а також ансамблеві підходи машинного навчання (випадковий ліс, XGBoost, LightGBM). Запропоновано метод випадкового лісу дерев оптимальної складності (ВЛДОС), що поєднує принципи МГУА, генетичних алгоритмів і методу аналізу ієрархій. Для побудови моделей застосовувалася технологія ієрархічної класифікації, а оцінювання їхньоїякості здійснювалося на основі метрик правильності, чутливості, специфічності, точності та F-міри. Обчислення проводилися на персональному комп’ютері з процесором Intel Core i5-9300H, 16 ГБ ОЗП, SSD на 512 ГБ і графічним процесором NVIDIA GeForce GTX 1660 Ti (6 ГБ). Використовувалося програмне забезпечення на мові Python. Результати та їх новизна. Розроблено нову технологію ієрархічної класифікації для аналізу цифрових зображень, що базується на ансамблевих методах машинного навчання, розширеному наборі текстурних ознак та методі ВЛДОС. Запропоновано модифікацію методу випадкового лісу (ВЛДОС), яка інтегрує принципи МГУА, генетичних алгоритмів та методу аналізу ієрархій. Уперше для стадіювання фіброзу печінки (ультразвукові знімки) та ідентифікації COVID-асоційованих легеневих патологій (зображення комп’ютерної томографії) застосовано розширений набір методів текстурного аналізу. Удосконалено методику кореляційного відбору ознак у мультикласових задачах. Основні характеристики та показники. Розроблена технологія забезпечує підвищення точності класифікації порівняно з традиційними методами. Для задачі стадіювання фіброзу печінки досягнуто правильності 67% (95% довірчий інтервал за методом бутстрепу: [0.58; 0.76]) та F-міри 0.68 на екзаменаційній вибірці, для задачі ідентифікації COVID-асоційованих патологій легень – 84% (95% довірчий інтервал: [0.75; 0.92]) та 0.84 відповідно. При мажоритарному голосуванні на рівні пацієнтів точність зросла до 75% (фіброз печінки) й 89% (патології легень) на екзаменаційній вибірці, а також до 95% і 94% відповідно на повній когорті пацієнтів. Впровадження. Результати роботи були впроваджені в ДУ «Інститут ядерної медицини та променевої діагностики НАМН України» (акт впровадження від «3» листопада 2022 року), ДУ «Інститут педіатрії, акушерства і гінекології імені академіка О.М. Лук’янової НАМН України» (акт впровадження від «13» червня 2024 року), ДУ «Національний науковий центр фтизіатрії, пульмонології та алергології ім. Ф.Г. Яновського НАМНУкраїни» (акт впровадження від «26» грудня 2024 року) та Інститут інформаційних технологій та систем НАН України (акт впровадження від «10 січня 2025 року). Зв'язок з іншими роботами. Робота виконана виконано в межах науково-дослідних проєктів кафедри біомедичної кібернетики КПІ ім. Ігоря Сікорського за темами № 0117U006934 «Методи та моделі ідентифікації станів біологічних об’єктів» і № 0123U100866 «Методи та моделі ідентифікації станів об’єктів в задачах прийняття медичних рішень». Рекомендації щодо використання результатів. Рекомендовано застосовувати запропоновану технологію для стадіювання фіброзу печінки на основі ультразвукових зображень та ідентифікації COVID-асоційованих легеневих патологій за даними комп’ютерної томографії у клінічній практиці. Сфера застосування. Медична діагностика, системи підтримки прийняття рішень, телемедицина. Економічна ефективність. Впровадження розробленого підходу здатне зменшити потребу в інвазивних методах обстеження (біопсія), скоротити час обробки зображень і підвищити точність діагностики, що може позитивно вплинути на загальні витрати на лікування й покращити результати терапії пацієнтів. Значимість роботи. Створена технологія становить суттєвий внесок у розвиток методів аналізу медичних зображень, сприяючи підвищенню ефективності діагностики та моніторингу захворювань. Робота має наукову новизну й практичну цінність. Висновки та пропозиції. Запропонована технологія ієрархічної класифікації на базі методу ВЛДОС і розширеного набору методів текстурного аналізу є ефективним інструментом обробки медичних зображень. Подальші дослідження доцільно спрямувати на вдосконалення методів групування класів, оптимізацію гіперпараметрів, розширення сфери застосування, автоматизацію процесу прийняття рішень, а також організацію масштабних клінічних випробувань для підтвердження ефективності та безпеки впровадження у клінічну практику. Особлива увага має приділятися етичним аспектам і прозорості алгоритмів машинного навчання в медицині.
dc.description.abstractotherBabenko V.O. Technology of Hierarchical Classification in the Diagnosis of Pathologies from Medical Images of Various Modalities. – A qualification research work presented as a manuscript. Dissertation for the degree of Doctor of Philosophy in Specialty 122 – “Computer Sciences”. – National Technical University of Ukraine “Igor Sikorsky Kyiv Polytechnic Institute,” Kyiv, 2025. The dissertation consists of an introduction, four chapters, conclusions, a list of references, and appendices, totaling 155 pages. It contains 18 figures and 25 tables. The list of references includes 117 sources, of which 16 are in Cyrillic and 101 in Latin script. Appendix A (3 pages) provides a list of publications and information on the approbation of the dissertation results; Appendix B (5 pages) contains information on implementation statements. Object of the study. Analysis of diagnostic images. Aim of the work. To enhance classification methods for improved accuracy in pathology detection using digital images. Methods of research. The study employed histogram processing, spatial filtering, segmentation with convolutional neural networks, texture analysis (firstorder statistics, GLCM, GLDS, GLRLM, NGTDM, SFM, Lowe’s texture energy, fractal analysis, LBP, histogram-based features, multi-region histograms, wavelet transforms, and convolutional neural networks), correlation analysis, and ensemble machine learning methods (Random Forest, XGBoost, LightGBM). A Random Forest of optimal complexity trees (RFOCT) was proposed, integrating the principles of GMDH, genetic algorithms, and the Analytic Hierarchy Process. Hierarchical classification technology was employed to build models, and their quality was evaluated using accuracy, sensitivity, specificity, precision, and Fmeasure. Calculations were carried out on a PC with an Intel Core i5-9300H CPU, 16 GB of RAM, a 512 GB SSD, and an NVIDIA GeForce GTX 1660 Ti (6 GB) GPU, using Python software. Results and novelty. A new hierarchical classification technology was developed for digital image analysis, based on ensemble machine learning methods, an extended set of texture features, and the RFOCT method. A modified Random Forest approach (RFOCT) was introduced, incorporating the principles of GMDH, genetic algorithms, and the Analytic Hierarchy Process. For the first time, an extended set of texture-analysis methods was applied to liver fibrosis staging (ultrasound images) and the identification of COVID-associated lung pathologies (CT images). A correlation-based feature selection technique for multiclass problems was improved. Main characteristics and indicators. The proposed technology increases classification accuracy compared to traditional methods. In the liver fibrosis staging task, accuracy reached 67% (95% bootstrap CI: [0.58; 0.76]) and an Fmeasure of 0.68 on the test sample. In identifying COVID-associated lung pathologies, accuracy reached 84% (95% CI: [0.75; 0.92]) with an F-measure of 0.84. Majority voting at the patient level increased accuracy to 75% (liver fibrosis) and 89% (lung pathologies) on the test sample, and up to 95% and 94% respectively on the full patient cohort. Implementation. The research findings have been implemented at the following institutions: State Institution “Institute of Nuclear Medicine and Radiation Diagnostics of the National Academy of Medical Sciences of Ukraine” (implementation certificate dated November 3, 2022), State Institution “O.M. Lukyanova Institute of Pediatrics, Obstetrics and Gynecology of the National Academy of Medical Sciences of Ukraine” (implementation certificate dated June 13, 2024), State Institution “F.G. Yanovsky National Scientific Center of Phthisiology, Pulmonology and Allergology of the National Academy of Medical Sciences of Ukraine” (implementation certificate dated December 26, 2024), and Institute of Information Technologies and Systems of National Academy of Sciences of Ukraine (implementation certificate dated January 10, 2025). Relation to other works. This research was performed within the scientific projects of the Department of Biomedical Cybernetics at Igor Sikorsky Kyiv Polytechnic Institute under topics No. 0117U006934 “Methods and Models for Identifying the States of Biological Objects” and No. 0123U100866 “Methods and Models for Identifying Object States in Medical Decision-Making Tasks.” Recommendations for using the results. It is recommended to apply the proposed technology to stage liver fibrosis based on ultrasound images and to identify COVID-associated lung pathologies from CT data in clinical practice. Scope of application. Medical diagnostics, decision support systems, telemedicine. Economic efficiency. Implementation of the proposed approach can reduce the need for invasive examination methods (such as biopsies), shorten image processing time, and improve diagnostic accuracy. This can lower overall treatment costs and enhance patient therapy outcomes. Significance of the work. The developed technology makes a substantial contribution to advancing medical image analysis methods, helping improve the effectiveness of disease diagnosis and monitoring. The research has scientific novelty and practical value. Conclusions and proposals. The proposed hierarchical classification technology, based on the RFOCT method and an extended set of texture-analysis techniques, is an effective tool for medical image processing. Future studies should focus on refining class-grouping methods, optimizing hyperparameters, expanding the scope of application, automating decision-making processes, and conducting large-scale clinical trials to confirm clinical effectiveness and safety. Special attention must be paid to ethical considerations and algorithmic transparency in medical machine learning.
dc.format.extent155 с.
dc.identifier.citationБабенко, В. О. Технологія ієрархічної класифікації в задачах діагностики патологій за медичними зображеннями різних модальностей : дис. ... доктора філософії / Бабенко Віталій Олегович. – Київ, 2025. – 155 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/74700
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectансамблеві методи
dc.subjectвалідація прогностичних моделей
dc.subjectгенетичний алгоритм
dc.subjectдерево прийняття рішень
dc.subjectзгорткові нейронні мережі
dc.subjectідентифікація
dc.subjectCOVID-19
dc.subjectметод групового урахування аргументів
dc.subjectмашинне навчання
dc.subjectнадійність
dc.subjectпрогнозування
dc.subjectпроцедура обробки зображень
dc.subjectприйняття рішень
dc.subjectтекстурний аналіз
dc.subjectфіброз печінки
dc.subjectensemble methods
dc.subjectvalidation of prognostic models
dc.subjectgenetic algorithm
dc.subjectdecision tree
dc.subjectconvolutional neural networks
dc.subjectidentification
dc.subjectGMDH
dc.subjectmachine learning
dc.subjectreliability
dc.subjectprediction
dc.subjectimage processing procedure
dc.subjectdecision-making
dc.subjecttexture analysis
dc.subjectliver fibrosis
dc.subject.udc004.89:616-073.75
dc.titleТехнологія ієрархічної класифікації в задачах діагностики патологій за медичними зображеннями різних модальностей
dc.title.alternativeTechnology of Hierarchical Classification in the Diagnosis of Pathologies from Medical Images of Various Modalities
dc.typeThesis Doctoral

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Babenko_dys.pdf
Розмір:
5.38 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: