Дисертації (ШІ)

Постійне посилання зібрання

https://ela.kpi.ua/handle/123456789/52508

У зібранні розміщено дисертації, які захищені працівниками кафедри.

Переглянути

Зараз показуємо 1 - 2 з 2

Відкритий доступ
Гібридні методи сегментації медичних зображень при наявності обмеженої кількості маркованих даних
(КПІ ім. Ігоря Сікорського, 2026) Рязановський, Кирило Денисович; Чумаченко, Олена Іллівна
Рязановський К. Д. Гібридні методи сегментації медичних зображень при наявності обмеженої кількості маркованих даних. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 122 «Комп’ютерні науки». – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2026. У дисертації здійснено всебічне дослідження теоретико-методичних засад, алгоритмічних рішень та прикладних аспектів розроблення гібридних методів сегментації медичних зображень в умовах обмеженості маркованих даних. Робота спрямована на подолання фундаментальної проблеми сучасної медичної візуалізації, а саме необхідності великих, збалансованих та експертно розмічених наборів даних для навчання глибоких нейронних мереж. Уперше запропоновано комплексну методологію, що інтегрує механізми трансферного навчання та напівкерованого навчання, доповнену системним використанням просторово-інтенсивнісних (4D) ймовірнісних атласів, метрик оптимального транспорту та регуляризації карт уваги. Актуальність дослідження зумовлена тим, що сегментація медичних зображень є фундаментальним етапом у діагностиці, плануванні лікування та моніторингу захворювань. Хоча моделі глибокого навчання, зокрема згорткові нейронні мережі, досягли значного прогресу, їх ефективність критично залежить від наявності великих обсягів маркованих даних. Процес створення таких наборів даних є головним вузьким місцем у впровадженні систем штучного інтелекту, оскільки він надзвичайно трудомісткий, дорогий і вимагає залучення висококваліфікованих медичних фахівців. В умовах обмежених даних класичні підходи втрачають ефективність через перенавчання та нездатність до узагальнення на нових зразках, що стимулює пошук гібридних рішень, здатних ефективно навчатися на невеликих наборах розмічених та великих обсягах нерозмічених даних. Мета дослідження полягає у підвищенні точності сегментації медичних зображень на коротких вибірках та зменшенні відсотку маркованих зразків у вибірці шляхом розробки методології, що інтегрує напівкероване та трансферне навчання з використанням ансамблів. Для досягнення поставленої мети було сформульовано шість задач: провести аналіз існуючих методів сегментації та підходів до навчання на обмежених даних; розробити гібридну методологію з п’ятиетапним конвеєром обробки; створити метод відбору донорського датасету на основі метрики оптимального транспорту для забезпечення максимальної ефективності переносу знань; розробити гібридний метод напівкерованого навчання з використанням 4D ймовірнісного атласу для генерації анатомічно правдоподібних сегментацій; розвинути метод формування ансамблю сегментаторів на основі конкурентного ранжування; реалізувати та валідувати розроблену методологію на реальних клінічних даних різних модальностей. Об’єктом дослідження є процес семантичної сегментації медичних зображень. Предметом дослідження виступають методи та моделі глибокого навчання для сегментації медичних зображень на коротких вибірках, засновані на комбінації трансферного навчання та напівкерованого навчання. Методи дослідження включають методи глибокого навчання (згорткові нейронні мережі), методи оптимізації, теорію ймовірностей та математичну статистику, методи обробки зображень, методи трансферного та напівкерованого навчання. У першому розділі «Теоретичні основи сегментації медичних зображень в умовах обмежених даних» досліджено особливості та складність медичних зображень, отриманих з ключових модальностей (комп’ютерна томографія, магнітно-резонансна томографія, ультразвукове дослідження), їх формати та специфічні виклики, такі як низька контрастність, наявність шумів та артефактів. Проаналізовано основні формати медичних зображень – DICOM та NIfTI – та їх вплив на побудову алгоритмів сегментації. Розглянуто методи попередньої обробки медичних зображень, включаючи зниження шуму за допомогою згорткових нейронних мереж та генеративно-змагальних мереж, підвищення якості таконтрастності зображень. Детально проаналізовано сучасні підходи до семантичної сегментації на основі глибокого навчання: архітектури U-Net та DeepLabV3+, тривимірні згорткові нейронні мережі, генеративно-змагальні мережі, ансамблеві методи, механізми уваги та візуальні трансформери. Окрему увагу приділено фундаментальним моделям сегментації, зокрема Segment Anything Model та його медичним адаптаціям (MedSAM), визначено їх ключові обмеження для клінічних задач, такі як залежність від підказок, нестабільна продуктивність на низькоконтрастних зображеннях та високі обчислювальні вимоги. Детально проаналізовано причини проблеми коротких вибірок, включаючи високу вартість та час експертної розмітки, питання приватності пацієнтів та проблему рідкісних захворювань. Виявлено фундаментальні недоліки глибоких моделей при навчанні на малих даних, зокрема перенавчання та низьку здатність до узагальнення. Систематизовано існуючі підходи до навчання на обмежених даних, розглянуто концепції трансферного навчання, напівкерованого навчання та аугментації даних, що стало теоретичною основою для їх подальшої гібридизації. Проведено критичний аналіз існуючих підходів комбінування трансферного та напівкерованого навчання, виявлено їх переваги та обмеження, що обґрунтувало доцільність розробки нової інтегрованої методології. У другому розділі «Дослідження методів трансферного та напівкерованого навчання для медичної сегментації» розроблено ключові компоненти наукової новизни дисертації. Розроблено підхід до трансферного навчання, в рамках якого вперше запропоновано метод відбору донорського датасету для сегментації, що базується на адаптованій метриці оптимального транспорту. Ця метрика використовує відстань Вассерштейна для кількісної оцінки відстані між наборами даних, моделюючи розподіл сегментів (їх положення та інтенсивності) за допомогою моделей гаусових сумішей. Процес відбору включає побудову GMM-представлень для кожного набору даних у просторі просторових координат та інтенсивностей вокселів, обчислення парних відстаней Вассерштейна між GMM-представленнями та ранжування кандидатів за мірою близькості до цільового домену. Це дозволяєздійснити кількісно обґрунтований вибір джерела для трансферного навчання та знизити ризики негативного переносу при некоректно обраному донорському датасеті. Також вперше створено метод напівкерованого навчання, що інтегрує апріорні знання у вигляді 4D ймовірнісного атласу, який поєднує просторові координати та інтенсивність вокселів. Цей атлас на основі моделей гаусових сумішей, побудований на обмежених маркованих даних, використовується для формування спеціалізованої функції втрат, що змушує модель генерувати анатомічно правдоподібні сегментації при навчанні на нерозмічених даних. Функція втрат включає три складові: стандартну компоненту для маркованих даних (комбінація Dice-втрат та перехресної ентропії), атлас-орієнтовану компоненту для нерозмічених даних (на основі KL-дивергенції між виходом моделі та ймовірнісним атласом) та компоненту регуляризації узгодженості карт уваги між моделями ансамблю. Описано алгоритми градієнтної оптимізації запропонованих функцій втрат та організацію навчального процесу на основі змішаних міні-батчів маркованих та немаркованих даних. У третьому розділі «Розроблення методології сегментації медичних зображень на основі інтеграції трансферного та напівкерованого навчання» обґрунтовано та розроблено єдину гібридну методологію. На відміну від відомих підходів, запропонована методологія системно інтегрує трансферне та напівкероване навчання в єдиний конвеєр. Центральним елементом, що об’єднує етапи, є ймовірнісний атлас на основі моделей гаусових сумішей, який виступає інформаційним хребтом всієї системи. Концепція включає п’ять послідовних етапів. Перший етап передбачає побудову 4D ймовірнісного атласу з короткої цільової вибірки. На другому етапі здійснюється принциповий відбір донорського набору даних для трансферного навчання на основі розробленої метрики оптимального транспорту. Третій етап полягає у попередньому навчанні ансамблю моделей (зокрема U-Net та DeepLabV3+) з модулями згорткової блокової уваги на відібраному донорському датасеті. Четвертий етап реалізує напівкероване донавчання з використанням гібридної функції втрат, що включає атлас-орієнтовані обмеження для нерозмічених даних тарегуляризацію узгодженості карт уваги між моделями ансамблю. На п’ятому етапі формується кінцевий прогноз шляхом зваженої агрегації ансамблю на основі розробленого конкурентного підходу до ранжування моделей. Наведено теоретичне обґрунтування синергії компонентів методології з позицій байєсівського виводу. У четвертому розділі «Експериментальна валідація та практичне впровадження методології» проведено експериментальну перевірку на трьох клінічних задачах: сегментації пухлин головного мозку на МРТ, вогнищ туберкульозу на КТ та вегетацій при інфекційному ендокардиті на ехокардіографії. Для кожної задачі підготовлено окремі набори даних із дотриманням стандартних протоколів поділу на навчальну, валідаційну та тестову підмножини. Як основну метрику використано коефіцієнт подібності Дайса. Результати показали стійке покращення запропонованої гібридної моделі: DSC склав 88.9% для пухлин мозку, 86.8% для туберкульозу та 79.6% для ендокардиту, що перевищує найкращий базовий метод в середньому на 3.2 відсоткових пункти (p < 0.01). Абляційне дослідження підтвердило синергетичний ефект інтеграції TL та SSL: видалення будь-якого з ключових компонентів (атлас-орієнтованих обмежень, регуляризації карт уваги або етапу трансферного навчання) призводило до статистично значущого зниження якості сегментації. Аналіз чутливості показав високу робастність методу: при зменшенні частки маркованих даних до 10% деградація DSC становила лише 6.0-7.1 пунктів проти 12-18 пунктів для класичних підходів, що підтверджує здатність запропонованої методології ефективно використовувати нерозмічені дані для компенсації дефіциту маркованих зразків. Розроблений ансамблевий метод експериментально показав приріст коефіцієнту Дайса на 6 пунктів, демонструючи ефективність розробленого конкурентного підходу до агрегації моделей. Основні висновки свідчать, що запропонована гібридна методологія стабільно перевершує всі базові підходи на всіх тестових наборах даних. Експериментально підтверджено наукову гіпотезу, що системна інтеграція TL та SSL, об’єднаних використанням ймовірнісних пріорів, дозволяє досягти високої якості та робастності сегментації навіть за умов критично обмежених маркованих даних (10-30%).Доведено, що використання ймовірнісного атласу як єдиного інформаційного хребта, що пов’язує етапи відбору донора, напівкерованого навчання та ансамблевої агрегації, створює синергетичний ефект, який перевищує результати ізольованого застосування кожного з компонентів. Розроблена методологія є універсальною та може бути адаптована до різних клінічних модальностей та анатомічних структур без суттєвих змін загальної архітектури конвеєра. Практичне значення одержаних результатів полягає у розробці методології та програмних систем, що дозволяють створювати високоточні моделі сегментації для специфічних клінічних завдань за наявності лише невеликої кількості розмічених експертами зображень. Це значно знижує витрати та прискорює впровадження систем штучного інтелекту в медичну практику. Розроблене програмне забезпечення може використовуватися у клінічних закладах для автоматизації процесу аналізу медичних зображень, підвищуючи ефективність діагностичного процесу та зменшуючи навантаження на медичних фахівців. Запропоновані методи дозволяють медичним установам впроваджувати системи автоматичної сегментації без необхідності збору великих розмічених наборів даних, що особливо актуально для рідкісних захворювань та нових діагностичних протоколів. Результати дисертаційної роботи та розроблені програмні системи для сегментації аномалій (пухлин мозку, туберкульозу легень, ендокардиту клапанів серця) протестовано на базі Національного наукового центру фтизіатрії, пульмонології та алергології імені Ф.Г. Яновського НАМН України та Інституту серця МОЗ України.
Відкритий доступ
Верифікація користувача методами глибокого навчання на основі поведінкових та біометричних характеристик
(КПІ ім. Ігоря Сікорського, 2024) Гаврилович, Марія Павлівна; Данилов, Валерій Якович
Гаврилович М.П. Верифікація користувача методами глибокого навчання на основі поведінкових та біометричних характеристик. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 122 “Комп’ютерні науки”. – Національний технічний університет України “Київський політехнічний інститут імені Ігоря Сікорського”, Київ, 2024. У дисертаційній роботі розглянуто питання побудови систем верифікації користувача на основі біометричних та поведінкових даних з допомогою нейронних мереж глибокого навчання. Потреба у надійних та високоефективних системах верифікації є надзвичайно актуальною у сфері безпеки, кібербезпеки, захисті персональних даних, медицини та ризикменеджменті. Традиційні методи верифікації, такі як паролі, карти доступу чи пін-коди і т.п. несуть великі ризики в разі їх втрати або компрометації, тому є потреба у побудові більш стійких систем безпеки та автентифікації. Біометричні дані є унікальними для кожного індивідуума, тому на їх основі можливо побудувати набагато надійніші системи верифікації. Неперервні біометричні та поведінкові сигнали, наприклад покази давачів руху (покази акселерометра, магнетометра, гіроскопа і т.п.), дають змогу реалізувати системи неперервної та неявної автентифікації. Оскільки біометричні сигнали є дуже складними по своїй природі, тому для розробки високоточної системи верифікації необхідна побудова нових потужних моделей, які мають високу предиктивну силу та можуть знаходити глибокі закономірності в даних з комплексною та глибокою структурою. Метою дослідження є розробка та аналіз методів машинного навчання, зокрема нейронних мереж глибокого навчання, для верифікації користувача на основі біометричних та поведінкових характеристик. У дисертації вперше отримані наступні нові наукові результати: 1. Розроблені нові гібридні архітектури, які базуються на стискуючих та варіаційних автокодувальниках з використанням трансформерів, для розв'язання задач верифікації на основі поведінкових та біометричних характеристик користувача, що дозволило досягти значного покращення критеріїв ефективності в порівнянні з існуючими методами. 2. На основі розроблених нових гібридних архітектур створена система підтримки прийняття рішень верифікації користувача. 3. Розроблено новий підхід для покращення точності систем біометричної верифікації, що базується на використанні величин фрактальних розмірностей. 4. Визначені та набули подальшого розвитку прикладні сценарії та компоненти системи верифікації на базі уточненої практичної методології побудови систем глибокого навчання на основі запропонованих архітектур. Теоретичне значення отриманих результатів полягає у вдосконаленні та подальшому розвитку методології побудови систем верифікації на базі нейронних мереж глибокого навчання. Створені та побудовані гібридні нейронні мережі дозволяють суттєво підвищити ефективність роботи систем біометричної верифікації, за рахунок поєднання переваг компонентів різних архітектур в одній нейронній мережі. На основі нових розроблених архітектур нейронних мереж виявлено та кількісно оцінено вплив величин фрактальних розмірностей на метрики якості систем верифікації. Практична цінність дисертаційної роботи: 1. розроблена оригінальна СППР неперервної біометричної верифікації користувача на основі нових гібридних архітектур нейронних мереж з використанням величин фрактальних розмірностей; 2. впроваджено в навчальний процес розроблені архітектури та уточнену методологію у вигляді відповідного силабусу, лекційного матеріалу та навчального посібника-практикума. Запропонована нова гібридна архітектура, яка базується на стискуючих автокодувальниках з використанням трансформерів, показує час висновку швидший на 31% відсоток та нижче в середньому на 11% відсотків значення рівного рівня помилок для всі типів фізичних активностей та їх комбінацій. Проведено аналіз впливу величин фрактальної розмірності Хігучі вхідних даних на ефективність системи верифікації на базі автокодувальників. Показано перевагу використання фрактальної розмірності даних на основні метрики якості, зокрема на рівний рівень помилок (в середньому на 13% відсотків нижче значення) та на значення площі під кривою (на 2.2% відсотків вищі показники) в порівнянні з системою верифікації без її врахування. Запропоновано СППР неперервної біометричної верифікації користувача на основі розроблених нових гібридних архітектур та з урахуванням фрактальної розмірності даних. На вхід розробленої системи надходять дані з різноманітних давачів (акселерометри, гіроскопи, магнетометри, тощо), які характеризують відповідні біометричні чи поведінкові показники особи. Під час етапу ініціалізації відбувається збір початкової необхідної кількості даних для тренування нових гібридних архітектур. На основі вдосконаленої практичної методології налаштування параметрів системи верифікації, перед тренуванням підбираються: відповідні значення розмірності вхідних даних в залежності від характеристик давачів; гіперпараметри архітектури нейронної мережі глибокого навчання; розраховується фрактальна розмірність даних кожного типу давача. В залежності від кількості та розмірності даних відбувається тренування моделей різних відповідних архітектур на окремих компонентах (скалярних, векторних) та на їх комбінаціях. Після тренування для кожної моделі отримуються значення відповідних критеріїв (час висновку, значення порогу верифікації). Відповідно до доступності сигналів для висновку системи верифікації вибирається модель, яка охоплює найбільший контекст та не перевищує установленого допустимого значення по часу висновку. Також, система має елемент моніторингу розподілу даних, який в залежності від їх зміни при необхідності ініціює дотренування моделей. Проведено порівняльний аналіз різних типів автокодувальників з класичними методами машинного навчання, як-от однокласові опорні машини векторів та ізоляційний ліс (Isolation Forest). Показано суттєву перевагу застосування автокодувальників над класичними методами машинного навчання, наприклад отримуємо на 7% вищу чутливість (recall) в порівнянні з ізоляційним лісом і на 75% вищу чутливість (recall) в порівнянні з однокласовими опорними машинами векторів. Також проведено глибокий аналіз впливу різних компонентів векторного біометричного сигналу та кількісно оцінено їх вплив на ефективність системи верифікації користувача. Встановлено, що в залежності від типу фізичної активності різні компоненти сигналу давача по різному впливають на метрики якості системи. Також, кількісно оцінено вплив компонентів сигналів давача в різних комбінаціях та доведено ефективність комбінацій компонентів векторного сигналу для досягнення вищої точності.

Переглянути

Нові надходження