Методи класифікації форм туберкульозу легень за даними комп’ютерної томографії на основі ансамблевої селекції ознак
Вантажиться...
Дата
2025
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Матвійчук О. В. Методи класифікації форм туберкульозу легень за даними комп’ютерної томографії на основі ансамблевої селекції ознак. – Кваліфікаційна наукова праця на правах рукопису.
Дисертація на здобуття наукового ступеня (доктора філософії) за спеціальністю 122 «Комп’ютерні науки» (12 - Інформаційні технології). – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2025.
Дисертаційна робота присвячена дослідженню даних комп’ютерної томографії легень у пацієнтів із туберкульозом легень та розробці методів диференціації лікарсько-чутливої та лікарсько-стійкої форми захворювання. Туберкульоз легень є другою за поширеністю інфекційною хворобою у світі та призвів у 2023 році до 1,3 млн смертей. Ефективна рання діагностика відіграє ключову роль у своєчасному призначенні лікування, особливо у випадках розвитку стійкості до протитуберкульозних препаратів. Для виявлення туберкульозу легень використовуються різні методи діагностики, зокрема мікробіологічний, молекулярно-генетичний, радіологічний, імунологічний та біохімічний. Застосування комп’ютерної томографії як рентгенологічного методу дозволяє швидко отримати зображення легень, оцінити наявність та ступінь уражень. Аналіз даних з зображень томографії дає змогу визначити форму та місце ураження легень туберкульозом, що є важливим етапом для подальшої розробки ефективних алгоритмів діагностики та оптимізації лікування. Проведено аналітичний огляд сучасних підходів до диференціації лікарськочутливої та лікарсько-стійкої туберкульозу із застосуванням методів машинного навчання. Розглянуто основні алгоритмічні підходи, включаючи використання штучних нейронних мереж, методів статистичного та текстурного аналізу, а також технологій сегментації для виділення зон інтересу на зображеннях комп’ютерної томографії. За результатами проведеного огляду встановлено, що комп’ютерна томографія легень містить ключові візуальні ознаки, які можуть бути використані для автоматизованої диференціації форм туберкульозу. Методи машинного навчання, зокрема згорткові нейронні мережі, демонструють високу точність у розпізнаванні структурних змін та класифікації патологічних процесів, що робить їх перспективним інструментом у діагностичних системах. Розглянуті сучасні методи мають проблеми з точністю класифікації лікарсько-чутливої та лікарсько-стійкої форми туберкульозу. Тому постає задача вдосконалення даних методів та технологій для збільшення точності діагностики, а також для підбору персоналізованої стратегії лікування. Для підвищення точності класифікації додано попередню обробку томографічних даних із виділенням легеневого вікна та визначенням площі легень, що дозволяє усунути надлишкову інформативність. В алгоритмі сегментації враховано можливість появи непромаркованих пікселів у середині легень та їх корекцію шляхом приєднання до виділеної області. Проведено дослідження з застосування методів текстурного аналізу для виділення ключових характеристик, що дозволяють більш точно ідентифікувати закономірності в структурі об’єктів на зображенні. Для отримання текстурних особливостей було застосовано різні типи матриць, зокрема – гістограма, матриця співвідношення рівнів сірого, матриця розміру зони рівнів сірого, матриця граничної довжини рівнів сірого. Перевагою використання матриць текстурних характеристик є збільшення інформативності отриманих даних за рахунок переходу від традиційного геометричного аналізу до оцінки текстури. Виділення настільки великої кількості ознак потребує механізму селекції інформативних ознак, для чого використано метод Minimum Redundancy Maximum Relevance. Побудована модель та методика моделювання ознак надає можливість впорядкувати ознаки за інформативністю та сформувати ансамбль найбільш релевантних за яким побудовано класифікатор. На основі сформованого ансамблю проведено дослідження, спрямоване на розробку класифікаційної моделі для визначення приналежності зображень до лікарсько-чутливого або лікарсько-стійкого класу. Для реалізації класифікаційного підходу застосовано метод випадкового лісу (Random Forest), який забезпечує високу стійкість до варіативності вхідних даних та знижує ризик перенавчання. Для підвищення точності класифікації розроблено модифіковану стратегію голосування в рамках ансамблю вирішальних правил. Відмінністю запропонованого підходу є адаптація стандартного алгоритму голосування шляхом введення вагових коефіцієнтів за допомогою методу групового урахування аргументів в комбінації з позиційним голосуванням, що дозволяє враховувати комплексні залежності між ознаками формуючи оптимізований ансамбль голосуючих моделей. Проведено дослідження, спрямоване на навчання глибокої залишкової нейронної мережі ResNet-50 для вирішення задачі класифікації зображень. Архітектура ResNet-50 обрана через здатність формування ознак на глибоких шарах, та наявності Encoder-Decoder модифікацій, що зменшує проблему зникання градієнта завдяки використанню залишкових зв’язків. Окремо розглянуто підхід гібридизації глибокої залишкової мережі із застосуванням ознак отриманих мережею та класифікатором випадкового лісу. Застосування з модифікованою функцією голосування дозволяє отримати альтернативний набір ознак перед подачею їх на класифікатор випадкового лісу. Метою роботи було удосконалення методів обчислювального інтелекту для збільшення точності класифікації лікарсько-чутливої та лікарсько-стійкої форм туберкульозу. В дисертацій отримані такі наукові результати: 1. Запропоновано метод селекції ансамблів інформативних ознак, який відрізняється поєднанням одновимірного послідовного відбору за міжкласовою, внутрішньокласовою дисперсією та визначенням оптимального набору ознак за критеріями інформативності та надмірності, що дозволяє зменшити обчислювальні ресурси та підвищити точність класифікації за даними великої розмірності. 2. Удосконалено метод прийняття рішень у колективах вирішувальних правил за рахунок додаткового впорядкування експертів по характеристиках компетентності на основі МГУА, що дозволяє модифікувати ваги в функції голосування для персоналізації рішень та підвищення точності класифікаторів з ансамблевою структурою 3. Вдосконалено метод визначення патологій на медичних зображеннях, в якому нейронна мережа з Encoder-Decoder архітектурою на основі ResNet50 для визначення зони патології доповнена оптимізованим ансамблевим класифікатором Random Forest, що надає можливість визначення класу патології за виокремленими Encoder частиною ознаками.
Опис
Ключові слова
класифікація, клас-орієнтована селекція ознак, метод групового урахування аргументів, багатопотоковість, методи оптимізації, математична оптимізація, математична модель, математична статистика, нейронні мережі, глибинне навчання, згорткові нейронні мережі, ResNet, системи основані на правилах, інформаційні технології, програмне забезпечення, classification, class-oriented feature selection, Group Method of Data Handling, multiprocessor computing, optimisation methods, mathematical optimisation, mathematical model, mathematical statistics, neural networks, deep learning, convolutional neural networks, rule-based systems, information technology, software development
Бібліографічний опис
Матвійчук, О. В. Методи класифікації форм туберкульозу легень за даними комп’ютерної томографії на основі ансамблевої селекції ознак : дис. ... доктора філософії / Матвійчук Олександр Вадимович. – Київ, 2025. – 140 с.