Метод сегментації зображень з використанням глибоких нейронних мереж
dc.contributor.advisor | Гордієнко, Юрій Григорович | |
dc.contributor.author | Статкевич, Роман Вадимович | |
dc.date.accessioned | 2024-06-21T14:01:11Z | |
dc.date.available | 2024-06-21T14:01:11Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Статкевич Р.В. Метод сегментації зображень з використанням глибоких нейронних мереж. – Кваліфікаційна наукова робота на правах рукопису Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 121 – Інженерія програмного забезпечення з галузі знань 12 – Інформаційні технології. – Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського», Київ, 2024. Дисертаційна робота присвячена розробці та удосконаленню нейронних мереж для семантичної сегментації зображень, що базуються на архітектурі U-Net, та дозволяє покращити результати та метрики передбачень, у порівнянні з базовою архітектурою. Аналіз зображень у контексті семантичної сегментації є однією з актуальних задач, що широко використовуються у різних галузях, таких як аналіз та діагностика медичних зображень, автономні автомобілі, тощо. Покращення методів семантичної сегментації дозволяє краще виявляти патології у людському організмі, а для систем управління автомобілем – краще розуміти навколишнє середовища та краще реагувати на виникнення небезпечних ситуацій у процесі дорожнього руху. Саме тому важливо постійно удосконалювати уже наявні методи. Тема дисертаційної роботи входить в план наукової роботи затвердженому на кафедрі обчислювальної техніки КПІ ім. Ігоря Сікорського, що враховує розпорядження Кабінету Міністрів України від 2 грудня 2020 р. № 1556-р про схвалення Концепції розвитку штучного інтелекту в Україні. Метою дисертації було покращення існуючих засобів аналізу зображень в контексті задач сегментації зображень, що дозволять отримувати більш точні результати. Для досягнення цієї мети, було поставлено та вирішено наступні завдання: - Проведено огляд та описано особливості основних архітектур нейронних мереж для аналізу зображень в контектсі задач класифікації та сегментації; - У деталях розглянуто сімейство нейронних мереж U-Net; - Запропоновано та обґрунтовано методи модифікації архітектур U-Net з використанням способу підбору коефіцієнта розширення та способу глибинних роздільних проміжних зв’язків. - Проведено велику кількість експериментів на різних наборах даних, з використанням різних підходів та запропонованих нововведень і К-кратної перехресної перевірки для підтвердження якісних покращень результатів. - Проведено виміри впливу запропонованого методу модифікації нейронної мережі U-Net на метрики швидкодії та пам’яті Запропоновано спосіб підбору коефіцієнту розширення архітектури U-Net, що дозволяє регулювати глибину нейронної мережі та збільшення (чи зменшення) кількості параметрів даної архітектури. Завдяки цьому з’явилася можливість оптимізувати розмір нейронної мережі, та отримати результати, співставні з результатами базової архітектури, при 2.5 меншій кількості параметрів нейронної мережі. Також було запропоновано спосіб глибинних роздільних проміжних зв’язків архітектури U-Net, що базується на основі глибинних роздільних згорткових шарів. Дана модифікація дозволила покращити точність сегментації при незначному збільшенні кількості параметрів. Разом з цим, ці модифікації дозволяють також покращувати результати не лише базової архітектури U-Net, але і її модифіковані версії, що було показано на прикладі Attention-UNet. Для різних наборів даних, було виявлено щонайменше один з варіантів модулів глибинних роздільних проміжних зв’язків, що дозволив покращити точність сегментації від 1% до 5%. У деяких випадках дане покращення було досягнуте за рахунок збільшення архітектури лише на 1%, що підтверджує якісні властивості даних змін. На основі запропонованих способів, було розроблено метод модифікації нейронних мереж U-Net для задач сегментації зображень, з використанням мови програмування Python та бібліотеки Tensorflow для експериментального підтвердження доцільності даних модифікацій. Експерименти було проведено у різних доменах знань, таких як аналіз медичних зображень, а також аналіз міського середовища. Також, запропоновані підходи були перевірені як на двовимірних зображеннях, так і тривимірних об’ємах, що підтверджує практичність застосування запропонованих у роботі способів модифікації нейронних мереж. Для експериментів використовувалися відомі набори даних, такі як UWGIT, BraTS, CityScapes, Synapse. Було також продемонстровано, що запропоновані модифікації дозволяють досягнути, а в деяких випадках, перевершити точність деяких відомих та широковживаних архітектур нейронних мереж. Окрім того, було проведено аналіз швидкодії та використання пам’яті для запропонованих модифікацій нейронних мереж. Було встановлено, що глибші мережі, які використовують підхід з коефіцієнтом розширення, можуть працювати швидше, аніж базова архітектура, при приблизно однаковій точності сегментації. Розроблений метод має велике практичне значення та широке поле для застосування у галузі аналізу зображень, що було експериментально підтверджено у ході досліджень. | |
dc.description.abstractother | Statkevych R. V. Methods of image segmentation using deep neural networks – Qualified scientific work on the rights of the manuscript. Dissertation for the degree of Doctor of Philosophy in the specialty 121 – Software engineering and 12 – Information Technologies – National Technical University of Ukraine “Igor Sikorsky Kyiv Polytechnic Institute”, Kyiv 2024. This work is dedicated to the development and improvement of the neural networks in a context of semantic segmentation, based on U-Net architecture, which allow to improve overall evaluation and performance metrics, compared to the baseline U-Net model. The topic of the dissertation was agreed by the Department of Computer Engineering of National Technical University of Ukraine “Ihor Sikorskiy Kyiv Polytechnic Institute”, in accordance with Cabinet of Ministers Order №1556-p on concept of development of Artificial Intelligence in Ukraine. The goal of dissertation was an improvement of existing semantic image segmentation methods, that allows to improve results an effectiveness of neural networks. To achieve the stated goal, next tasks and problems were solved: - Existing semantic image segmentation methods and neural network’s architectures. - Family of U-Net neural network architectures were studied in detail. - As part of the proposed method, expansion rate variation and depthwise separable skip connections were proposed as modifications to the baseline U-Net architecture. - Large number of experiments were conducted on different datasets, using different approaches and proposed novel improvements. To confirm a quality nature of the change, K-fold cross-validation was performed; - To get inference time and memory usage metrics, benchmark was conducted for the proposed improvements and modifications. The proposed expansion rate variation method allows the developer to regulate the number of parameters for the U-Net network, enabling deeper networks with fewer parameters. Using this approach, it is possible to optimize the size and the performance of the model and get the same evaluation results as a baseline model, with 2.5 less parameters. Another proposal is using Depthwise Separable Skip Connections, based on Depthwise Separable Convolutions. This modification allowed to improve results of the model with relatively small size increase for a model. It is also possible to improve other U-Net-like models, as demonstrated on the Attention-UNet model. For different datasets, at least one of the suggested modifications managed to improve a result of the baseline model, with this improvement measured between 1-5%. It was also shown on the K-fold cross-validation, that these modifications could steadily outperform the baseline model. In some cases, this improvement was achieved by model with just 1% increase of a number of parameters, which proves this is a quality improvement. Utilizing the proposed modifications, a method for image segmentation using modified U-Net architectures was developed with Python programming language and tensorflow library, to prove a feasibility of these modifications. Experiments were conducted in different knowledge domains, such as Computer Assisted Diagnostics and road environment analysis. Also, these methods were used for analysing both 2 dimensional images and 3 dimensional volumes, which proves the practicality of using these methods. For the experiments, such well-known state-of-the-art datasets were used, as University of Wisconsin Gastrointestinal (UWGIT), Cityscapes, Synapse, and Brain Tumor Segmentation (BraTS). It was also demonstrated that the proposed methods may match, and sometimes outperform some of the State-Of-The-Art models, aside from baseline U-Net. Besides that, some performance and productivity metrics were measured for the proposed network architectures. It was noted, that a deeper networks with expansion rate approach may have better inference times than a baseline model and match its quality. The suggested methods have a big practical value and a wide range of applications in a field of image analysis, that was proven during the conducted experiments. | |
dc.format.extent | 157 с. | |
dc.identifier.citation | Статкевич, Р. В. Метод сегментації зображень з використанням глибоких нейронних мереж : дис. … д-ра філософії : 121 Інженерія програмного забезпечення / Статкевич Роман Вадимович. – Київ, 2024. – 157 c. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/67345 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | нейронні мережі | |
dc.subject | машинне навчання | |
dc.subject | сегментація зображень | |
dc.subject | U-Net | |
dc.subject | аналіз медичних зображень | |
dc.subject | аналіз міського середовища | |
dc.subject | ком’ютерний зір | |
dc.subject | Neural Networks | |
dc.subject | Machine Learning | |
dc.subject | Image Segmentation | |
dc.subject | Medical Image Analysis | |
dc.subject | Urban Environment Analysis | |
dc.subject | Computer Vision | |
dc.subject.udc | 004.032.26 (043.3) | |
dc.title | Метод сегментації зображень з використанням глибоких нейронних мереж | |
dc.type | Thesis Doctoral |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Statkevych_dys.pdf
- Розмір:
- 6.17 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: