Напівкероване навчання зорового трансформера для задачі сегментації дорожнього трафіку в неструктурованому середовищі

dc.contributor.advisorШаповал, Наталія Віталіївна
dc.contributor.authorШабо, Олексій Андрійович
dc.date.accessioned2025-02-27T10:10:15Z
dc.date.available2025-02-27T10:10:15Z
dc.date.issued2024
dc.description.abstractМагістерська дисертація: 143 c., 20 рис., 24 табл., 43 посилання, додаток. Тема дослідження – напівкероване навчання зорового трансформера для задачі сегментації дорожнього трафіку в неструктурованому середовищі. Об’єкт дослідження – набір даних з Indian Driving Dataset для семантичної сегментації, що складається з 373 маркованих та 2603 немаркованих тренувальних, 700 валідаційних та 1048 тестових зображень. Предмет дослідження – методи комп’ютерного зору і напівкерованого навчання. Мета дослідження – створення алгоритму напівкерованого навчання зорового трансформера, що міг би виконувати багатокласову семантичну сегментацію об’єктів в неструктурованому середовищі. Розроблено програмний продукт на мові програмування Python. На основні проведених у цій роботі досліджень доведено ефективність запропонованого способу напівкерованого навчання моделі зорового трансформера, що здатна виконувати сегментацію в такому неструктурованому середовищі, як (при)міські дороги в Індії. Основні положення матеріалів роботи доповідались на міжнародній науково- технічній і всеукраїнській науково-практичній конференціях та були опубліковані у фаховому виданні категорії “Б”. У межах подальшого дослідження пропонується оптимізація роботи програмного продукту для мобільних та крайових пристроїв, а також інтеграція цієї схеми тренування у систему автономної навігації на дорозі.
dc.description.abstractotherMaster’s thesis: 143 p., 20 figures, 24 tables, 43 references, appendix. The research topic is the semi-supervised learning of a vision transformer for the task of road traffic segmentation in an unstructured environment. The object of the study is the Indian Driving Dataset for semantic segmentation, consisting of 373 labeled and 2603 unlabeled training, 700 validation, and 1048 test images. The subject of research is methods of computer vision and semi-supervised learning. The purpose of the work is to create a semi-supervised learning algorithm of a vision transformer that could perform multi-class semantic segmentation of objects in an unstructured environment. A software product was developed in the Python programming language. The effectiveness of the semi-supervised learning method for the vision transformer model, capable of performing segmentation in unstructured environments such as (sub)urban roads in India, was demonstrated based on the research conducted in this work. The main findings of this work were presented at an international scientific and technical conference, as well as at an all-Ukrainian scientific and practical conference, and were published in a category "B" professional journal. As part of further research, it is proposed to optimize the software product for mobile and edge devices and incorporate this training scheme into an autonomous road navigation system.
dc.format.extent143 с.
dc.identifier.citationШабо, О. А. Напівкероване навчання зорового трансформера для задачі сегментації дорожнього трафіку в неструктурованому середовищі : магістерська дис. : 122 Комп'ютерні науки / Шабо Олексій Андрійович. - Київ, 2024. - 143 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/72725
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectнапівкероване навчання
dc.subjectзоровий трансформер
dc.subjectсемантична сегментація
dc.subjectнеструктуроване середовище
dc.subjectнабір даних idd
dc.subjectsemi-supervised learning
dc.subjectvision transformer
dc.subjectsemantic segmentation
dc.subjectunstructured environment
dc.subjectidd dataset
dc.subject.udc004.85:004.932.2:656.021(043.3)
dc.titleНапівкероване навчання зорового трансформера для задачі сегментації дорожнього трафіку в неструктурованому середовищі
dc.typeMaster Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Shabo_magistr.pdf
Розмір:
2.14 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: