Метод класифікації онкологічних захворювань легень на основі структурних патернів зображень комп’ютерної томографії

Вантажиться...
Ескіз

Дата

2026

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Давидович І.В. Метод класифікації онкологічних захворювань легень на основі структурних патернів зображень комп’ютерної томографії. — Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 122 «Комп’ютерні науки» (12 - Інформаційні технології). – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2026. Дисертаційна робота присвячена дослідженню даних комп’ютерної томографії легень у пацієнтів із раком легень та розробці методів диференціації типів захворювання. Онкологічні захворювання легень залишаються однією з провідних причин смертності у світі. За глобальною статистикою у 2022 році було діагностовано близько 2,48 млн нових випадків та зафіксовано 1,8 млн смертей. В Україні значна частка випадків виявляється на пізніх стадіях, що підкреслює критичну потребу своєчасної діагностики. Важливу роль у виявленні патології відіграє медична візуалізація, зокрема комп’ютерна томографія (КТ) органів грудної клітини, яка використовується як базовий інструмент діагностичного уточнення та моніторингу стану захворювання, що здатні знижувати смертність завдяки ранньому виявленню пухлин. Водночас збільшення обсягів КТ-даних і складність їх інтерпретації створюють істотне навантаження на спеціалістів і підсилюють запит на автоматизовані методи, здатні виділяти діагностично значущу інформацію. Диференціація гістологічних типів визначає вибір тактики лікування та прогноз, тому підвищення точності інтерпретації КТ-даних є клінічно значущим. Проведено аналітичний огляд сучасних підходів до цифрової обробки та аналізу КТ-зображень легень у задачах онкологічної діагностики, включно з радіомікою, текстурними характеристиками, методами глибокого навчання, та підходів на основі Bag-of-Visual-Words для виділення інформативних ознак на зображеннях комп’ютерної томографії. За результатами проведеного огляду встановлено, що комп’ютерна томографія містить приховані структурні закономірності, які можуть бути використані для автоматизованої класифікації типів раку. Існуючі методи, зокрема глибокі нейронні мережі, демонструють високу точність, проте потребують великих обсягів якісно анотованих даних і часто не є у повній мірі прозорими у процесі прийняття рішень. Це ускладнює їх клінічну інтерпретацію та впровадження. Розглянуті сучасні методи мають проблеми зі стійкістю до варіативності вхідних даних та дисбалансу діагностичних класів при диференціації різних гістологічних типів. Тому постає задача вдосконалення методів виділення ознак та класифікації для забезпечення високої точності та інтерпретованості діагностики в умовах обмежених вибірок. Для підвищення інформативності даних розроблено метод селекції інтенсивностей пікселів для попередньої обробки зображень, що дозволяє виокремити найбільш репрезентативні діапазони яскравості для кожного класу патології. В алгоритмі попередньої обробки враховано необхідність зменшення розмірності простору інтенсивностей шляхом операції квантування та відбору пікселів, що формують стійкі структурні компоненти зображень, ігноруючи шумову складову. Селекція виконується шляхом узгодження інтенсивностей пікселів з урахуванням типових розподілів яскравостей для кожного класу, що зменшує міжсканерну варіативність та пригнічує артефакти, підвищуючи стабільність подальшого аналізу. Проведено дослідження із застосування методів виділення локальних структурних патернів для ідентифікації специфічних закономірностей у будові пухлинної тканини. На відміну від традиційних методів текстурного аналізу, які узагальнюють просторові залежності пікселів у вигляді інтегральних статистик, запропонований підхід формує явний словник мікроструктур шляхом сканування зображення ковзним вікном і подальшого підрахунку частот появи типових локальних конфігурацій. Таке подання є дискретизованим описом текстури, де замість обмеженої кількості агрегованих показників зберігається інформація про склад і розподіл конкретних локальних структур. Перевагою запропонованого підходу є використання методів статистичного зважування ознак, що дозволяє зменшити вплив фонових патернів та підсилити внесок рідкісних, але потенційно діагностично значущих структур. Виділення унікальних патернів дозволяє перейти від аналізу окремих пікселів до оцінки частотного розподілу локальних конфігурацій. Дискретний словник виділених структур дає змогу аналізувати внесок окремих патернів у рішення моделі та полегшує експертну верифікацію виявлених закономірностей. Для числового подання виокремлених структур проаналізовано декілька альтернативних схем формування опису ознак, які відрізняються ступенем узагальнення та чутливістю до частотного профілю патернів. Побудовані моделі та методика формування простору ознак надає можливість впорядкувати патерни за їх дискримінативною здатністю та сформувати вектори ознак, на основі яких побудовано класифікатор. Проаналізовано підходи до нормування частот патернів, їх зважування та відбору найбільш інформативних ознак, що забезпечує формування компактного вектора у єдиному порядку компонент, визначеному спільним словником патернів для всіх класів й наборів даних. На основі сформованого набору ознак проведено дослідження, спрямоване на розробку архітектури класифікатора для багатокласової діагностики гістологічних типів раку. Запропоновано реалізацію багатокласового класифікатора за стратегію каскадного «один проти решти» (One-vs-Rest), на базі логістичної регресії, що дозволяє послідовно відокремлювати класи, зменшуючи неоднорідність вибірки на кожному кроці. Для підвищення точності класифікації розроблено алгоритм автоматичного відбору порядку слідування класів та адаптивного підбору порогів прийняття рішень, що дозволяє враховувати специфіку дисбалансу даних та мінімізувати помилки розпізнавання для найбільш складних для розпізнавання класів. Проведено порівняльне дослідження ефективності запропонованого підходу з низкою моделей машинного навчання та глибокого навчання, включно з лінійними методами, ансамблями дерев рішень і градієнтного бустингу, багаторівневими ансамблями, а також нейромережевими архітектурами. Перевірку виконано на незалежній тестовій вибірці, що дозволило оцінити узагальнювальну здатність підходу на нових даних. За результатами порівняльних експериментів запропонований підхід за обраних параметрів попередньої обробки забезпечив точність на рівні 0.949±0.048 та макро-F1-міри 0.916±0.074. Додаткова перевірка в умовах ізольованої обробки навчальної та тестової вибірок підтвердила відтворюваність отриманих результатів і практичну придатність для сценарію застосування на нових даних. У додатковому, більш консервативному сценарії отримано точність на рівні 0.805, макро-F1-міра 0.766. Метою роботи було підвищення точності та інтерпретованості автоматизованої диференційної діагностики гістологічних типів раку легень за даними комп’ютерної томографії шляхом розроблення методу багатокласової класифікації на основі локальних структурних патернів. У дисертації отримані такі наукові результати: 1. Запропоновано метод селекції інтенсивностей пікселів КТ-зображень у межах області інтересу, який зменшує вплив випадкових коливань яскравості та узгоджує вхідні дані шляхом побудови нормованих розподілів інтенсивностей і їх послідовного усереднення. Це забезпечує подальший відбір найбільш репрезентативної частини діапазону відтінків сірого та пригнічення фонових й неспецифічних значень. 2. Розроблено спосіб виокремлення часто повторюваних локальних структурних патернів для подальшої їх селекції з метою отримання компактного та інформативного набору ознак. Запропонований спосіб відрізняється формуванням словника структур і поєднанням частотного та дискримінативного відбору. 3. Розроблено алгоритм багатокласової класифікації за стратегією каскадного «один проти решти» (One-vs-Rest), що відрізняється послідовним відокремленням класів з покроковим звуженням множини альтернатив на кожному етапі та автоматизованим підбором порядку проходження класів. Це забезпечує зменшення кількості помилок для малопредставлених і тому складних для розпізнавання класів. Практичне значення отриманих результатів. Реалізовано технологію формування структурно орієнтованого опису ознак на основі виокремлення локальних клас-специфічних патернів в області інтересу з подальшою селекцією інформативних структур. За результатами проведених досліджень розроблено інформаційну систему автоматизованого аналізу зображень комп’ютерної томографії легень, орієнтовану на багатокласову диференціацію гістологічних типів раку легень. Доведено практичну цінність моделі багатокласової класифікації за стратегією каскадного «один проти решти», що забезпечує підвищення стабільності результатів за нерівномірної представленості різних нозологічних груп.

Опис

Ключові слова

нейронні мережі, машинне навчання, обробка медичних зображень, медична візуалізація, сегментація зображення, класифікація зображень, точність класифікації, розподіл частот інтенсивностей пікселів, статистичний розподіл, ознаки, прогнозування, стратегія лікування, рання діагностика, структурні патерни, рак легень, neural network, machine learning, medical image processing, medical visualization, image segmentation, image classification, classification accuracy, pixel intensity frequency distribution, statistical distribution, features, prediction, treatment strategy, early diagnosis, structural patterns, lung cancer

Бібліографічний опис

Давидович, І. В. Метод класифікації онкологічних захворювань легень на основі структурних патернів зображень комп’ютерної томографії : дис. … д-ра філософії : 122 Комп’ютерні науки / Давидович Ілля Вікторович. - Київ, 2026. - 147 с.

ORCID

DOI