Порівняльний аналіз нейромережевих методів і моделей розпізнавання та сегментації об’єктів у візуальних процесах будівельного середовища

dc.contributor.advisorХайдуров, Владислав Володимирович
dc.contributor.authorДанілов, Костянтин Валентинович
dc.date.accessioned2025-06-09T08:18:24Z
dc.date.available2025-06-09T08:18:24Z
dc.date.issued2025
dc.description.abstractКваліфікаційна робота містить: 65 сторінок, 8 рисунків, 3 таблиці, 23 джерела. Розвиток комп’ютерного зору відкриває широкі можливості для автоматизованого аналізу візуальної інформації, зокрема у будівельній галузі. Це має особливе значення для контролю за технічним станом об’єктів та забезпечення безпеки праці. Одним з основних напрямів такого аналізу є сегментація екземплярів, яка дозволяє точно відокремлювати кожен об’єкт на зображенні. Складність сцен на будівельних майданчиках вимагає застосування сучасних глибоких моделей, здатних до високоточної сегментації. У цій роботі проведено порівняльний аналіз трьох сучасних нейромережевих архітектур для сегментації екземплярів: двоетапної Mask R-CNN, одноетапної YOLOv8l-seg та трансформерної Mask2Former. Дослідження базувалося на реальному наборі даних Alberta Constructіon іmage Dataset (ACіD), який містить зображення будівельної техніки. У межах роботи було виконано попередню обробку даних, навчання моделей та їх оцінювання за метриками середньої точності (mAP) та швидкодії (FPS). Результати експериментів показали, що Mask2Former досягає найвищої якості сегментації, YOLOv8l-seg забезпечує максимальну швидкодію при збереженні високої точності, тоді як Mask R-CNN поступається сучаснішим підходам за загальною ефективністю. Отримані висновки можуть слугувати основою для обґрунтованого вибору оптимальної моделі залежно від конкретних вимог до точності або швидкодії у практичних задачах.
dc.description.abstractotherThe qualifying paper contains: 65 pages, 8 figures, 3 tables, 23 references. The development of computer vision opens up wide opportunities for automated analysis of visual information, particularly in the construction industry. This is especially important for monitoring the technical condition of objects and ensuring workplace safety. One of the main directions of such analysis is instance segmentation, which allows for accurate separation of each object in an image. The complexity of construction site scenes necessitates the use of advanced deep learning models capable of high-accuracy segmentation. This study presents a comparative analysis of three modern neural network architectures for instance segmentation: the two-stage Mask R-CNN, the one-stage YOLOv8l-seg, and the transformer-based Mask2Former. The research was based on the real-world Alberta Construction Image Dataset (ACID), which contains images of construction machinery. Within the scope of the work, data preprocessing, model training, and their evaluation by mean Average Precision (mAP) and inference speed (FPS) metrics were performed. Experimental results demonstrate that Mask2Former achieves the highest segmentation accuracy, YOLOv8l-seg provides the fastest inference while maintaining high precision, whereas Mask R-CNN lags behind more modern approaches in overall performance. These findings provide a foundation for selecting an optimal model based on the specific trade-offs between accuracy and speed in practical applications.
dc.format.extent65 с.
dc.identifier.citationДанілов, К. В. Порівняльний аналіз нейромережевих методів і моделей розпізнавання та сегментації об’єктів у візуальних процесах будівельного середовища : дипломна робота ... бакалавра : 113 Прикладна математика / Данілов Костянтин Валентинович. – Київ, 2025. – 65 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/74119
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectкомп’ютерний зір
dc.subjectсегментація екземплярів
dc.subjectбудівельне середовище
dc.subjectmask r-cnn
dc.subjectyolov8-seg
dc.subjectmask2former
dc.subjectacіd
dc.titleПорівняльний аналіз нейромережевих методів і моделей розпізнавання та сегментації об’єктів у візуальних процесах будівельного середовища
dc.title.alternativeComparative Analysis of Neural Network Methods and Models for Object Recognition and Segmentation in Visual Processes of Construction Environments
dc.typeBachelor Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Danilov_bakalavr.pdf
Розмір:
11.32 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: