Моделі глибинного навчання на складних для розпізнавання наборах даних
dc.contributor.advisor | Куссуль, Наталія Миколаївна | |
dc.contributor.author | Охріменко, Антон Олександрович | |
dc.date.accessioned | 2025-06-20T12:06:28Z | |
dc.date.available | 2025-06-20T12:06:28Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Охріменко А.О. Моделі глибинного навчання на складних для розпізнавання наборах даних. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 113 «Прикладна математика» (галузь знань 11 «Математика та Статистика»). – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2024. Останнім часом широко використовуються методи машинного навчання для вирішення різноманітних практичних завдань. Дані методи найкраще працюють, якщо різні класи рівномірно представлені у навчальній вибірці. На практиці, реальні набори даних часто не відповідають цій умові, класи у них можуть бути незбалансованими та перекриватися за своїми ознаками. Особливо це проявляється у задачі сегментації, де на кожному зображенні з навчальної вибірки може бути присутні одразу декілька класів у різній пропорції. Як наслідок, модель машинного навчання погано розпізнає наймеш представлені класи. Метою роботи є розробка нових ефективних методів навчання моделей для задачі сегментації при наявній проблемі незбалансованості та перекриття класів у навчальному наборі даних. Існують стандартні засоби, що застосовуються для балансування вибірок, такі як збільшення ваги малих класів у функції втрат, чи збалансоване формування навчального пакету. Науковці розробляють нові методи, такі як особлива обробка даних в областях перекриття класів, генерація штучних екземплярів даних та динамічні вагові коефіцієнти. Дані підходи не є універсальними та не враховують особливості самих даних. Зокрема, не враховується роздільність представників різних класів та ступінь повноти ознак у наборі даних. Тому актуальною є розробка нових методів, що враховують властивості даних, а також нових методів балансування навчальних наборів. Перший розділ дисертаційного дослідження присвячений огляду робіт інших дослідників, що присвячені проблемі незбалансованості, перекриття класів та випадку їх комбінації. Проведено аналіз даних методів, окреслено основні групи поточних досліджень, визначено недоліки кожної групи, сформульовано завдання дисертаційного дослідження. Окрім того, розглянуто підходи, що специфічні для предметних областей даного дослідження. У другому розділі досліджується задача визначення неоднозначних екземплярів даних, які важко коректно віднести до правильного класу через подібність їхніх ознак до представників іншого класу, тобто наявна проблема перекриття класів. Запропоновано метод виявлення неоднозначних екземплярів даних серед навчальної вибірки. Описаний метод апробовано на штучно згенерованому наборі даних. У третьому розділі запропоновано метод вагових масок для покращення розрізнення малих класів у задачі семантичної сегментації на прикладі визначення сільськогосподарських культур на супутникових знімках. Модифіковано функцію втрат до використання вагових масок, що згенеровані відповідно до належності різних пікселів зображення до неоднозначних екземплярів даних. Показано, що у порівнянні з базовою сегментаційною моделлю, використання вагових масок значно покращує метрики малих класів, а також спостерігається незначний приріст загальних метрик. У четвертому розділі досліджується можливість використання генеративних змагальних мереж (GAN) для генерації штучних зображень та балансування навчального набору даних для багатоканальних супутникових знімків. Даний підхід порівнюється з іншими методами генерації штучних зображень, а також перевіряється можливість застосування методу вагових масок з попереднього розділу. Показано, що у порівнянні з базовою сегментаційною моделлю, використання GAN суттєво покращує якість роботи моделі. Окрім того, продемонстровано, що інші методи генерації штучних зображень показують гірші результати у порівнян ні з запропонованим методом. Використання методу вагових масок у комбінації з GAN-аугментацією також покращує метрики моделі. У п’ятому розділі розроблений метод вагових масок апробований в іншій предметній області, а саме у задачі семантичної сегментації гістологічних зображень. Запропоновано модифікацію методу виявлення неоднозначних екземплярів даних, спрямовану на врахування деяких просторових властивостей зображення. Це дозволило згенерувати більш досконалі вагові маски. Підтверджено ефективність методу вагових масок, що значно покращує метрики малих класів, у порівнянні з базовою сегментаційною моделлю. Наукова новизна отриманих результатів: 1. Вперше розроблено метод виявлення неоднозначних даних на основі KNN, що дозволяє ефективно ідентифікувати екземпляри даних, які викликають труднощі через подібність між класами. 2. Вперше запропоновано метод аугментації супутникових зображень з використанням генеративних змагальних мереж (GAN), що забезпечує генерацію нових зразків для компенсації незбалансованості класів. 3. Запропоновано нові метрики для оцінки якості датасетів, які враховують незбалансованість та перекриття класів, що дозволяє точніше аналізувати якість навчальних даних. 4. Удосконалено функції втрат через введення вагових масок, що дозволяє адаптувати процес навчання сегментаційних моделей до умов незбалансованих даних. 5. Отримав подальший розвиток метод вагових масок для компенсації незбалансованості класів, що дозволяє коригувати навчання без втручання в розмір чи структуру датасету. Практичне значення отриманих результатів. Результати, отримані у даній роботі, застосовані в наступних проектах: 1. Науковий проект програми Horizon Europe «Satellites for Wilderness Inspec tion and Forest Threat Tracking» (SWIFTT) (грантова угода 101082732, 2022- 2025). 2. Науковий проект НФД України «Методи і моделі глибинного навчання для прикладних задач супутникового моніторингу» (2020.02/0292, 2020-2023). 3. Науково-технічна робота (НТР) «Інформаційні технології геопросторового аналізу розвитку сільських територій і громад» (Договір РН/27-2023 від 25 травня 2023 р.) за рахунок зовнішнього інструменту допомоги Європейського Союзу для виконання зобов’язань України у Рамковій програмі Європейського Союзу з наукових досліджень і інновацій «Горизонт 2020». Розроблені методи практично застосовані в різних областях машинного навчання, передусім для моделей, що використовують функцію втрат для свого навчання. Окрім того, GAN-аугментація може бути використана для більш широкого класу моделей, а метод визначення частки неоднозначних даних та його майбутні модифікації можуть бути використаний для оцінки якості навчальних даних для різних видів задач машинного навчання. За матеріалами дисертації опубліковано 6 робіт, з яких 2 статті у міжнародних журналах, що індексуються у Scopus (квартилі Q2 та Q3), 1 стаття в журналі, що входить до переліку фахових видань за спеціальністю дисертації, 1 одноосібний розділ у монографії та 2 публікації у матеріалах міжнародних конференцій. | |
dc.description.abstractother | Okhrimenko A.O. Deep learning models for handling handcase data. – Qualifying scientific work, the manuscript. PhD thesis in the in speciality 113 Applied Mathematics (field of knowledge 11 “Mathematics and Statistics”). ― National Technical University of Ukraine “Igor Sikorsky Kyiv Polytechnic Institute”, Kyiv, 2024. Recently, machine learning methods have been widely used to solve various practical problems. These methods perform best if different classes are evenly represented in the training dataset. However, real-world datasets often do not meet this condition, as classes may be imbalanced and overlap in the feature space. This issue is especially evident in segmentation tasks, where multiple classes may be present in varying proportions within each training image. As a result, machine learning models tend to perform poorly in recognizing underrepresented classes. The aim of this study is to develop novel, effective training methods for segmentation models in the presence of class imbalance and overlapping in the training dataset. There are standard techniques for balancing datasets, such as increasing the weight of underrepresented classes in the loss function or using balanced batch sampling. Researchers are developing new methods, including specialized data processing in classoverlapping regions, synthetic data generation, and dynamic weighting coefficients. However, these approaches are not universal and do not take into account the specific characteristics of the data. In particular, they often fail to consider the separability of different classes and the completeness of feature representation in the dataset. Therefore, the development of new methods that take data properties into account, as well as novel approaches for balancing training datasets, remains a relevant research field. The first chapter of this thesis is dedicated to reviewing previous research on the issues of class imbalance, class overlapping, and their combination. An analysis of existing methods has been conducted, key research directions have been outlined, and the limitations of each approach have been identified. Based on this analysis, the research objectives of the dissertation have been formulated. Additionally, domainspecific approaches relevant to this study have been considered. The second chapter explores the problem of ambiguous data instance detection. Such instances are difficult to correctly assign a class label due to their feature similarity with instances from other classes, i.e., the issue of class overlap. A method for detecting ambiguous data instances within the training dataset is proposed. The described method has been tested on an artificially generated dataset. In the third chapter, a weighted mask method is proposed to improve the distinction of small classes in the semantic segmentation problem using the example of crop identification in satellite images. The loss function is modified to use weight masks, which are generated based on the assignment of different image pixels to ambiguous data instances. The results show that, compared to the baseline segmentation model, the use of weighted masks significantly improves the metrics of small classes while also presenting a slight increase in overall performance metrics. The fourth chapter explores the possibility of using Generative Adversarial Networks (GAN) for generating synthetic images and balancing the training dataset for multichannel satellite images. This approach is compared with other methods of synthetic image generation, and the applicability of the weight mask method from the previous chapter is also tested. The results show that, compared to the baseline segmentation model, the use of GAN significantly improves the model quality. Additionally, it is demonstrated that other synthetic image generation methods yield poorer results compared to the proposed approach. Combining the weight mask method with GAN augmentation also enhances the model metrics. In the fifth chapter, the developed weight mask method is tested in different domains, specifically in the task of semantic segmentation of histological images. A mod ification of the ambiguous data instance detection method is proposed, aimed at considering some spatial properties of the image. This modification allowed for the generation of more advanced weight masks. The effectiveness of the weight mask method is confirmed, significantly improving the metrics for small classes compared to the baseline segmentation model. The scientific novelty of the obtained results: 1. For the first time, a method for detecting ambiguous data based on KNN is developed, which effectively identifies data instances that cause difficulties due to class similarity. 2. For the first time, a satellite image augmentation method using Generative Adversarial Networks (GAN) is proposed, enabling the generation of new samples to compensate the class imbalance. 3. New metrics for assessing dataset quality are proposed, which take into account a class imbalance and overlapping, which allows for a more accurate analysis of training data quality. 4. The loss functions have been improved by introducing weight masks, which adapt the training process of segmentation models to unbalanced data conditions. 5. The weight mask method for compensating class imbalance has been further developed, enabling training adjustments without altering the size or structure of the dataset. The practical significance of the obtained results. The results obtained in this study have been applied in the following projects: 1. Scientific project of the program Horizon Europe «Satellites for Wilderness Inspection and Forest Threat Tracking» (SWIFTT) (grant agreement 101082732, 2022-2025). 2. Scientific project of the NRF of Ukraine «Deep learning methods and models for applied problems of satellite monitoring» (2020.02/0292, 2020-2023). 3. Scientific and technical project «Information technologies for geospatial analy sis of rural and community development» (Contract PH/27-2023 dated May 25, 2023) financed by the external aid instrument of the European Union for the fulfillment of Ukraine‘s obligations in the European Union Framework Program for Scientific Research and Innovation «Horizon 2020». The developed methods have practical applications in various areas of machine learning, primarily for models that use a loss function for training. Additionally, GAN augmentation can be used with a broader class of models, and the method for determining the proportion of ambiguous data instances and its future modifications can be used to assess the quality of training data for various types of machine learning tasks. Based on the materials of the thesis, 6 works have been published, including 2 articles in international journals indexed in Scopus (Q2 and Q3 quartiles), 1 article in a journal included in the list of professional publications for the thesis‘s specialty, 1 individual chapter in a monograph, and 2 publications in the proceedings of international conferences. | |
dc.format.extent | 118 с. | |
dc.identifier.citation | Охріменко, А. О. Моделі глибинного навчання на складних для розпізнавання наборах даних : дис. … д-ра філософії : 113 – Прикладна математика / Охріменко Антон Олександрович. – Київ, 2024. – 118 с. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/74356 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | машинне навчання | |
dc.subject | глибинне навчання | |
dc.subject | нейронна мережа | |
dc.subject | алгоритм k-найближчих сусідів | |
dc.subject | оцінка якості датасету | |
dc.subject | перекриття класів | |
dc.subject | незбалансованість класів | |
dc.subject | сегментація | |
dc.subject | генеративна змагальна мережа | |
dc.subject | генерація навчальних даних | |
dc.subject | генеративний штучний інтелект | |
dc.subject | аугментація | |
dc.subject | функція втрат | |
dc.subject | міра неконформності | |
dc.subject | machine learning | |
dc.subject | deep learning | |
dc.subject | neural network | |
dc.subject | k-nearest neighbors algorithm | |
dc.subject | dataset quality assessment | |
dc.subject | class overlapping | |
dc.subject | class imbalance | |
dc.subject | segmentation | |
dc.subject | generative adversarial network | |
dc.subject | training data generation | |
dc.subject | generative artificial intelligence | |
dc.subject | augmentation | |
dc.subject | loss function | |
dc.subject | measure of nonconformity | |
dc.subject.udc | 004.8, 004.93 | |
dc.title | Моделі глибинного навчання на складних для розпізнавання наборах даних | |
dc.type | Thesis Doctoral |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Okhrimenko_dys.pdf
- Розмір:
- 13.32 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: