Напівкероване навчання зорового трансформера для задачі сегментації дорожнього трафіку в неструктурованому середовищі
dc.contributor.advisor | Шаповал, Наталія Віталіївна | |
dc.contributor.author | Шабо, Олексій Андрійович | |
dc.date.accessioned | 2025-02-27T10:10:15Z | |
dc.date.available | 2025-02-27T10:10:15Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Магістерська дисертація: 143 c., 20 рис., 24 табл., 43 посилання, додаток. Тема дослідження – напівкероване навчання зорового трансформера для задачі сегментації дорожнього трафіку в неструктурованому середовищі. Об’єкт дослідження – набір даних з Indian Driving Dataset для семантичної сегментації, що складається з 373 маркованих та 2603 немаркованих тренувальних, 700 валідаційних та 1048 тестових зображень. Предмет дослідження – методи комп’ютерного зору і напівкерованого навчання. Мета дослідження – створення алгоритму напівкерованого навчання зорового трансформера, що міг би виконувати багатокласову семантичну сегментацію об’єктів в неструктурованому середовищі. Розроблено програмний продукт на мові програмування Python. На основні проведених у цій роботі досліджень доведено ефективність запропонованого способу напівкерованого навчання моделі зорового трансформера, що здатна виконувати сегментацію в такому неструктурованому середовищі, як (при)міські дороги в Індії. Основні положення матеріалів роботи доповідались на міжнародній науково- технічній і всеукраїнській науково-практичній конференціях та були опубліковані у фаховому виданні категорії “Б”. У межах подальшого дослідження пропонується оптимізація роботи програмного продукту для мобільних та крайових пристроїв, а також інтеграція цієї схеми тренування у систему автономної навігації на дорозі. | |
dc.description.abstractother | Master’s thesis: 143 p., 20 figures, 24 tables, 43 references, appendix. The research topic is the semi-supervised learning of a vision transformer for the task of road traffic segmentation in an unstructured environment. The object of the study is the Indian Driving Dataset for semantic segmentation, consisting of 373 labeled and 2603 unlabeled training, 700 validation, and 1048 test images. The subject of research is methods of computer vision and semi-supervised learning. The purpose of the work is to create a semi-supervised learning algorithm of a vision transformer that could perform multi-class semantic segmentation of objects in an unstructured environment. A software product was developed in the Python programming language. The effectiveness of the semi-supervised learning method for the vision transformer model, capable of performing segmentation in unstructured environments such as (sub)urban roads in India, was demonstrated based on the research conducted in this work. The main findings of this work were presented at an international scientific and technical conference, as well as at an all-Ukrainian scientific and practical conference, and were published in a category "B" professional journal. As part of further research, it is proposed to optimize the software product for mobile and edge devices and incorporate this training scheme into an autonomous road navigation system. | |
dc.format.extent | 143 с. | |
dc.identifier.citation | Шабо, О. А. Напівкероване навчання зорового трансформера для задачі сегментації дорожнього трафіку в неструктурованому середовищі : магістерська дис. : 122 Комп'ютерні науки / Шабо Олексій Андрійович. - Київ, 2024. - 143 с. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/72725 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | напівкероване навчання | |
dc.subject | зоровий трансформер | |
dc.subject | семантична сегментація | |
dc.subject | неструктуроване середовище | |
dc.subject | набір даних idd | |
dc.subject | semi-supervised learning | |
dc.subject | vision transformer | |
dc.subject | semantic segmentation | |
dc.subject | unstructured environment | |
dc.subject | idd dataset | |
dc.subject.udc | 004.85:004.932.2:656.021(043.3) | |
dc.title | Напівкероване навчання зорового трансформера для задачі сегментації дорожнього трафіку в неструктурованому середовищі | |
dc.type | Master Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Shabo_magistr.pdf
- Розмір:
- 2.14 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: