Метод сегментації зображень з використанням глибоких нейронних мереж
Вантажиться...
Дата
2024
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Статкевич Р.В. Метод сегментації зображень з використанням глибоких нейронних мереж. – Кваліфікаційна наукова робота на правах рукопису
Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 121 – Інженерія програмного забезпечення з галузі знань 12 – Інформаційні технології. – Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського», Київ, 2024.
Дисертаційна робота присвячена розробці та удосконаленню нейронних мереж для семантичної сегментації зображень, що базуються на архітектурі U-Net, та дозволяє покращити результати та метрики передбачень, у порівнянні з базовою архітектурою. Аналіз зображень у контексті семантичної сегментації є однією з актуальних задач, що широко використовуються у різних галузях, таких як аналіз та діагностика медичних зображень, автономні автомобілі, тощо. Покращення методів семантичної сегментації дозволяє краще виявляти патології у людському організмі, а для систем управління автомобілем – краще розуміти навколишнє середовища та краще реагувати на виникнення небезпечних ситуацій у процесі дорожнього руху. Саме тому важливо постійно удосконалювати уже наявні методи. Тема дисертаційної роботи входить в план наукової роботи затвердженому на кафедрі обчислювальної техніки КПІ ім. Ігоря Сікорського, що враховує розпорядження Кабінету Міністрів України від 2 грудня 2020 р. № 1556-р про схвалення Концепції розвитку штучного інтелекту в Україні. Метою дисертації було покращення існуючих засобів аналізу зображень в контексті задач сегментації зображень, що дозволять отримувати більш точні результати. Для досягнення цієї мети, було поставлено та вирішено наступні завдання: - Проведено огляд та описано особливості основних архітектур нейронних мереж для аналізу зображень в контектсі задач класифікації та сегментації; - У деталях розглянуто сімейство нейронних мереж U-Net; - Запропоновано та обґрунтовано методи модифікації архітектур U-Net з використанням способу підбору коефіцієнта розширення та способу глибинних роздільних проміжних зв’язків. - Проведено велику кількість експериментів на різних наборах даних, з використанням різних підходів та запропонованих нововведень і К-кратної перехресної перевірки для підтвердження якісних покращень результатів. - Проведено виміри впливу запропонованого методу модифікації нейронної мережі U-Net на метрики швидкодії та пам’яті Запропоновано спосіб підбору коефіцієнту розширення архітектури U-Net, що дозволяє регулювати глибину нейронної мережі та збільшення (чи зменшення) кількості параметрів даної архітектури. Завдяки цьому з’явилася можливість оптимізувати розмір нейронної мережі, та отримати результати, співставні з результатами базової архітектури, при 2.5 меншій кількості параметрів нейронної мережі. Також було запропоновано спосіб глибинних роздільних проміжних зв’язків архітектури U-Net, що базується на основі глибинних роздільних згорткових шарів. Дана модифікація дозволила покращити точність сегментації при незначному збільшенні кількості параметрів. Разом з цим, ці модифікації дозволяють також покращувати результати не лише базової архітектури U-Net, але і її модифіковані версії, що було показано на прикладі Attention-UNet. Для різних наборів даних, було виявлено щонайменше один з варіантів модулів глибинних роздільних проміжних зв’язків, що дозволив покращити точність сегментації від 1% до 5%. У деяких випадках дане покращення було досягнуте за рахунок збільшення архітектури лише на 1%, що підтверджує якісні властивості даних змін. На основі запропонованих способів, було розроблено метод модифікації нейронних мереж U-Net для задач сегментації зображень, з використанням мови програмування Python та бібліотеки Tensorflow для експериментального підтвердження доцільності даних модифікацій. Експерименти було проведено у різних доменах знань, таких як аналіз медичних зображень, а також аналіз міського середовища. Також, запропоновані підходи були перевірені як на двовимірних зображеннях, так і тривимірних об’ємах, що підтверджує практичність застосування запропонованих у роботі способів модифікації нейронних мереж. Для експериментів використовувалися відомі набори даних, такі як UWGIT, BraTS, CityScapes, Synapse. Було також продемонстровано, що запропоновані модифікації дозволяють досягнути, а в деяких випадках, перевершити точність деяких відомих та широковживаних архітектур нейронних мереж. Окрім того, було проведено аналіз швидкодії та використання пам’яті для запропонованих модифікацій нейронних мереж. Було встановлено, що глибші мережі, які використовують підхід з коефіцієнтом розширення, можуть працювати швидше, аніж базова архітектура, при приблизно однаковій точності сегментації. Розроблений метод має велике практичне значення та широке поле для застосування у галузі аналізу зображень, що було експериментально підтверджено у ході досліджень.
Опис
Ключові слова
нейронні мережі, машинне навчання, сегментація зображень, U-Net, аналіз медичних зображень, аналіз міського середовища, ком’ютерний зір, Neural Networks, Machine Learning, Image Segmentation, Medical Image Analysis, Urban Environment Analysis, Computer Vision
Бібліографічний опис
Статкевич, Р. В. Метод сегментації зображень з використанням глибоких нейронних мереж : дис. … д-ра філософії : 121 Інженерія програмного забезпечення / Статкевич Роман Вадимович. – Київ, 2024. – 157 c.