Аналіз графічних зображень з урахуванням контексту за допомогою нейронних мереж

dc.contributor.advisorЯйлимова, Ганна Олексіївна
dc.contributor.authorОбрядін, Денис Вадимович
dc.date.accessioned2025-06-17T08:27:21Z
dc.date.available2025-06-17T08:27:21Z
dc.date.issued2025
dc.description.abstractДипломна робота містить 79 сторінок, 1 додаток, 31 зображення і посилається на 25 джерел. Ця бакалаврська робота досліджує розробку системи аналізу зображень, яка включає контекстне розуміння з використанням сучасних методів глибогоко машинного навчання. Дослідження починається з огляду класичних дескрипторів ознак та згорткових нейронних мереж, а потім переходить до сучасних архітектур, таких як візуальні трансформатори та гібридні моделі. На основі цього аналізу було реалізовано архітектуру, що поєднує Swin Transformer, Feature Pyramid Network (FPN) та Faster R-CNN, для досягнення точного виявлення об'єктів з урахуванням контексту зображення. Запропоноване рішення підкреслює важливість інтеграції як локальних, так і глобальних ознак для детального розуміння сцени. Для оптимізації продуктивності на пристроях з обмеженими ресурсами, робота також досліджує методи стиснення моделі, включаючи лінійну увагу, адаптацію LoRA, обрізання та квантування. Остаточна модель була навчена та протестована на наборі даних COCO 2017 за допомогою Python та PyTorch у Google Colab. Експериментальні результати показують, що модель поступово покращує точність виявлення зі збільшенням розміру набору даних та часу навчання. Робота завершується оцінкою компромісів між обчислювальною ефективністю та точністю виявлення, пропонуючи розуміння практичного впровадження контекстно-залежних систем комп'ютерного зору.
dc.description.abstractotherThe thesis contains 79 pages, 1 appendix, 31 images, and refers to 25 sources. This bachelor's thesis explores the development of an image analysis system that incorporates contextual understanding using modern deep learning techniques. The study begins with a review of classical feature descriptors and convolutional neural networks, then transitions into contemporary architectures such as visual transformers and hybrid models. Based on this analysis, an architecture combining Swin Transformer, Feature Pyramid Network (FPN), and Faster R-CNN was implemented to achieve accurate object detection with contextual awareness. The proposed solution emphasizes the importance of integrating both local and global features for robust scene understanding. To optimize performance on resource-constrained devices, the thesis also investigates model compression techniques, including linear attention, LoRA adaptation, pruning, and quantization. The final model was trained and tested on the COCO 2017 dataset using Python and PyTorch within Google Colab. Experimental results demonstrate that the model progressively improves detection accuracy with increased dataset size and training time. The work concludes with an evaluation of the trade-offs between computational efficiency and detection accuracy, offering insights into practical deployments of context-aware computer vision systems.
dc.format.extent79 с.
dc.identifier.citationОбрядін, Д. В. Аналіз графічних зображень з урахуванням контексту за допомогою нейронних мереж : дипломна робота ... бакалавра : 113 Прикладна математика / Обрядін Денис Вадимович. – Київ, 2025. – 79 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/74274
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectглибоке навчання
dc.subjectаналіз зображень
dc.subjectSwin Transformer
dc.subjectвиявлення об'єктів
dc.subjectконтекст
dc.subjectCNN
dc.subjectFPN
dc.subjectFaster R-CNN
dc.subjectоптимізація моделі
dc.subjectdeep learning
dc.subjectimage analysis
dc.subjectSwin Transformer
dc.subjectobject detection
dc.subjectcontext
dc.subjectCNN
dc.subjectFPN
dc.subjectFaster R-CNN
dc.subjectmodel optimization
dc.titleАналіз графічних зображень з урахуванням контексту за допомогою нейронних мереж
dc.typeBachelor Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Obryadin_bakalavr.pdf
Розмір:
2.94 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: