Гібридні методи сегментації медичних зображень при наявності обмеженої кількості маркованих даних
Вантажиться...
Дата
2026
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Рязановський К. Д. Гібридні методи сегментації медичних зображень при наявності обмеженої кількості маркованих даних. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 122 «Комп’ютерні науки». – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2026.
У дисертації здійснено всебічне дослідження теоретико-методичних засад, алгоритмічних рішень та прикладних аспектів розроблення гібридних методів сегментації медичних зображень в умовах обмеженості маркованих даних. Робота спрямована на подолання фундаментальної проблеми сучасної медичної візуалізації, а саме необхідності великих, збалансованих та експертно розмічених наборів даних для навчання глибоких нейронних мереж. Уперше запропоновано комплексну методологію, що інтегрує механізми трансферного навчання та напівкерованого навчання, доповнену системним використанням просторово-інтенсивнісних (4D) ймовірнісних атласів, метрик оптимального транспорту та регуляризації карт уваги. Актуальність дослідження зумовлена тим, що сегментація медичних зображень є фундаментальним етапом у діагностиці, плануванні лікування та моніторингу захворювань. Хоча моделі глибокого навчання, зокрема згорткові нейронні мережі, досягли значного прогресу, їх ефективність критично залежить від наявності великих обсягів маркованих даних. Процес створення таких наборів даних є головним вузьким місцем у впровадженні систем штучного інтелекту, оскільки він надзвичайно трудомісткий, дорогий і вимагає залучення висококваліфікованих медичних фахівців. В умовах обмежених даних класичні підходи втрачають ефективність через перенавчання та нездатність до узагальнення на нових зразках, що стимулює пошук гібридних рішень, здатних ефективно навчатися на невеликих наборах розмічених та великих обсягах нерозмічених даних. Мета дослідження полягає у підвищенні точності сегментації медичних зображень на коротких вибірках та зменшенні відсотку маркованих зразків у вибірці шляхом розробки методології, що інтегрує напівкероване та трансферне навчання з використанням ансамблів. Для досягнення поставленої мети було сформульовано шість задач: провести аналіз існуючих методів сегментації та підходів до навчання на обмежених даних; розробити гібридну методологію з п’ятиетапним конвеєром обробки; створити метод відбору донорського датасету на основі метрики оптимального транспорту для забезпечення максимальної ефективності переносу знань; розробити гібридний метод напівкерованого навчання з використанням 4D ймовірнісного атласу для генерації анатомічно правдоподібних сегментацій; розвинути метод формування ансамблю сегментаторів на основі конкурентного ранжування; реалізувати та валідувати розроблену методологію на реальних клінічних даних різних модальностей. Об’єктом дослідження є процес семантичної сегментації медичних зображень. Предметом дослідження виступають методи та моделі глибокого навчання для сегментації медичних зображень на коротких вибірках, засновані на комбінації трансферного навчання та напівкерованого навчання. Методи дослідження включають методи глибокого навчання (згорткові нейронні мережі), методи оптимізації, теорію ймовірностей та математичну статистику, методи обробки зображень, методи трансферного та напівкерованого навчання. У першому розділі «Теоретичні основи сегментації медичних зображень в умовах обмежених даних» досліджено особливості та складність медичних зображень, отриманих з ключових модальностей (комп’ютерна томографія, магнітно-резонансна томографія, ультразвукове дослідження), їх формати та специфічні виклики, такі як низька контрастність, наявність шумів та артефактів. Проаналізовано основні формати медичних зображень – DICOM та NIfTI – та їх вплив на побудову алгоритмів сегментації. Розглянуто методи попередньої обробки медичних зображень, включаючи зниження шуму за допомогою згорткових нейронних мереж та генеративно-змагальних мереж, підвищення якості таконтрастності зображень. Детально проаналізовано сучасні підходи до семантичної сегментації на основі глибокого навчання: архітектури U-Net та DeepLabV3+, тривимірні згорткові нейронні мережі, генеративно-змагальні мережі, ансамблеві методи, механізми уваги та візуальні трансформери. Окрему увагу приділено фундаментальним моделям сегментації, зокрема Segment Anything Model та його медичним адаптаціям (MedSAM), визначено їх ключові обмеження для клінічних задач, такі як залежність від підказок, нестабільна продуктивність на низькоконтрастних зображеннях та високі обчислювальні вимоги. Детально проаналізовано причини проблеми коротких вибірок, включаючи високу вартість та час експертної розмітки, питання приватності пацієнтів та проблему рідкісних захворювань. Виявлено фундаментальні недоліки глибоких моделей при навчанні на малих даних, зокрема перенавчання та низьку здатність до узагальнення. Систематизовано існуючі підходи до навчання на обмежених даних, розглянуто концепції трансферного навчання, напівкерованого навчання та аугментації даних, що стало теоретичною основою для їх подальшої гібридизації. Проведено критичний аналіз існуючих підходів комбінування трансферного та напівкерованого навчання, виявлено їх переваги та обмеження, що обґрунтувало доцільність розробки нової інтегрованої методології. У другому розділі «Дослідження методів трансферного та напівкерованого навчання для медичної сегментації» розроблено ключові компоненти наукової новизни дисертації. Розроблено підхід до трансферного навчання, в рамках якого вперше запропоновано метод відбору донорського датасету для сегментації, що базується на адаптованій метриці оптимального транспорту. Ця метрика використовує відстань Вассерштейна для кількісної оцінки відстані між наборами даних, моделюючи розподіл сегментів (їх положення та інтенсивності) за допомогою моделей гаусових сумішей. Процес відбору включає побудову GMM-представлень для кожного набору даних у просторі просторових координат та інтенсивностей вокселів, обчислення парних відстаней Вассерштейна між GMM-представленнями та ранжування кандидатів за мірою близькості до цільового домену. Це дозволяєздійснити кількісно обґрунтований вибір джерела для трансферного навчання та знизити ризики негативного переносу при некоректно обраному донорському датасеті. Також вперше створено метод напівкерованого навчання, що інтегрує апріорні знання у вигляді 4D ймовірнісного атласу, який поєднує просторові координати та інтенсивність вокселів. Цей атлас на основі моделей гаусових сумішей, побудований на обмежених маркованих даних, використовується для формування спеціалізованої функції втрат, що змушує модель генерувати анатомічно правдоподібні сегментації при навчанні на нерозмічених даних. Функція втрат включає три складові: стандартну компоненту для маркованих даних (комбінація Dice-втрат та перехресної ентропії), атлас-орієнтовану компоненту для нерозмічених даних (на основі KL-дивергенції між виходом моделі та ймовірнісним атласом) та компоненту регуляризації узгодженості карт уваги між моделями ансамблю. Описано алгоритми градієнтної оптимізації запропонованих функцій втрат та організацію навчального процесу на основі змішаних міні-батчів маркованих та немаркованих даних. У третьому розділі «Розроблення методології сегментації медичних зображень на основі інтеграції трансферного та напівкерованого навчання» обґрунтовано та розроблено єдину гібридну методологію. На відміну від відомих підходів, запропонована методологія системно інтегрує трансферне та напівкероване навчання в єдиний конвеєр. Центральним елементом, що об’єднує етапи, є ймовірнісний атлас на основі моделей гаусових сумішей, який виступає інформаційним хребтом всієї системи. Концепція включає п’ять послідовних етапів. Перший етап передбачає побудову 4D ймовірнісного атласу з короткої цільової вибірки. На другому етапі здійснюється принциповий відбір донорського набору даних для трансферного навчання на основі розробленої метрики оптимального транспорту. Третій етап полягає у попередньому навчанні ансамблю моделей (зокрема U-Net та DeepLabV3+) з модулями згорткової блокової уваги на відібраному донорському датасеті. Четвертий етап реалізує напівкероване донавчання з використанням гібридної функції втрат, що включає атлас-орієнтовані обмеження для нерозмічених даних тарегуляризацію узгодженості карт уваги між моделями ансамблю. На п’ятому етапі формується кінцевий прогноз шляхом зваженої агрегації ансамблю на основі розробленого конкурентного підходу до ранжування моделей. Наведено теоретичне обґрунтування синергії компонентів методології з позицій байєсівського виводу. У четвертому розділі «Експериментальна валідація та практичне впровадження методології» проведено експериментальну перевірку на трьох клінічних задачах: сегментації пухлин головного мозку на МРТ, вогнищ туберкульозу на КТ та вегетацій при інфекційному ендокардиті на ехокардіографії. Для кожної задачі підготовлено окремі набори даних із дотриманням стандартних протоколів поділу на навчальну, валідаційну та тестову підмножини. Як основну метрику використано коефіцієнт подібності Дайса. Результати показали стійке покращення запропонованої гібридної моделі: DSC склав 88.9% для пухлин мозку, 86.8% для туберкульозу та 79.6% для ендокардиту, що перевищує найкращий базовий метод в середньому на 3.2 відсоткових пункти (p < 0.01). Абляційне дослідження підтвердило синергетичний ефект інтеграції TL та SSL: видалення будь-якого з ключових компонентів (атлас-орієнтованих обмежень, регуляризації карт уваги або етапу трансферного навчання) призводило до статистично значущого зниження якості сегментації. Аналіз чутливості показав високу робастність методу: при зменшенні частки маркованих даних до 10% деградація DSC становила лише 6.0-7.1 пунктів проти 12-18 пунктів для класичних підходів, що підтверджує здатність запропонованої методології ефективно використовувати нерозмічені дані для компенсації дефіциту маркованих зразків. Розроблений ансамблевий метод експериментально показав приріст коефіцієнту Дайса на 6 пунктів, демонструючи ефективність розробленого конкурентного підходу до агрегації моделей. Основні висновки свідчать, що запропонована гібридна методологія стабільно перевершує всі базові підходи на всіх тестових наборах даних. Експериментально підтверджено наукову гіпотезу, що системна інтеграція TL та SSL, об’єднаних використанням ймовірнісних пріорів, дозволяє досягти високої якості та робастності сегментації навіть за умов критично обмежених маркованих даних (10-30%).Доведено, що використання ймовірнісного атласу як єдиного інформаційного хребта, що пов’язує етапи відбору донора, напівкерованого навчання та ансамблевої агрегації, створює синергетичний ефект, який перевищує результати ізольованого застосування кожного з компонентів. Розроблена методологія є універсальною та може бути адаптована до різних клінічних модальностей та анатомічних структур без суттєвих змін загальної архітектури конвеєра. Практичне значення одержаних результатів полягає у розробці методології та програмних систем, що дозволяють створювати високоточні моделі сегментації для специфічних клінічних завдань за наявності лише невеликої кількості розмічених експертами зображень. Це значно знижує витрати та прискорює впровадження систем штучного інтелекту в медичну практику. Розроблене програмне забезпечення може використовуватися у клінічних закладах для автоматизації процесу аналізу медичних зображень, підвищуючи ефективність діагностичного процесу та зменшуючи навантаження на медичних фахівців. Запропоновані методи дозволяють медичним установам впроваджувати системи автоматичної сегментації без необхідності збору великих розмічених наборів даних, що особливо актуально для рідкісних захворювань та нових діагностичних протоколів. Результати дисертаційної роботи та розроблені програмні системи для сегментації аномалій (пухлин мозку, туберкульозу легень, ендокардиту клапанів серця) протестовано на базі Національного наукового центру фтизіатрії, пульмонології та алергології імені Ф.Г. Яновського НАМН України та Інституту серця МОЗ України.
Опис
Ключові слова
глибоке навчання, аналіз медичних зображень, обробка зображень, напівкероване навчання, трансферне навчання, нейронні мережі, згорткові нейронні мережі, класифікація, оптимізація, сегментація, оптимальний транспорт, механізм уваги, ансамблеві методи, машинне навчання, штучний інтелект, deep learning, medical image analysis, image processing, semisupervised learning, transfer learning, neural networks, convolutional neural networks, classification, optimization, segmentation, optimal transport, attention mechanism, ensemble methods, machine learning, artificial intelligence
Бібліографічний опис
Рязановський, К. Д. Гібридні методи сегментації медичних зображень при наявності обмеженої кількості маркованих даних : дис. … д-ра філософії : 122 Комп’ютерні науки / Рязановський Кирило Денисович. – Київ, 2026. – 192 с.