Аналіз графічних зображень з урахуванням контексту за допомогою нейронних мереж
| dc.contributor.advisor | Яйлимова, Ганна Олексіївна | |
| dc.contributor.author | Обрядін, Денис Вадимович | |
| dc.date.accessioned | 2025-06-17T08:27:21Z | |
| dc.date.available | 2025-06-17T08:27:21Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Дипломна робота містить 79 сторінок, 1 додаток, 31 зображення і посилається на 25 джерел. Ця бакалаврська робота досліджує розробку системи аналізу зображень, яка включає контекстне розуміння з використанням сучасних методів глибогоко машинного навчання. Дослідження починається з огляду класичних дескрипторів ознак та згорткових нейронних мереж, а потім переходить до сучасних архітектур, таких як візуальні трансформатори та гібридні моделі. На основі цього аналізу було реалізовано архітектуру, що поєднує Swin Transformer, Feature Pyramid Network (FPN) та Faster R-CNN, для досягнення точного виявлення об'єктів з урахуванням контексту зображення. Запропоноване рішення підкреслює важливість інтеграції як локальних, так і глобальних ознак для детального розуміння сцени. Для оптимізації продуктивності на пристроях з обмеженими ресурсами, робота також досліджує методи стиснення моделі, включаючи лінійну увагу, адаптацію LoRA, обрізання та квантування. Остаточна модель була навчена та протестована на наборі даних COCO 2017 за допомогою Python та PyTorch у Google Colab. Експериментальні результати показують, що модель поступово покращує точність виявлення зі збільшенням розміру набору даних та часу навчання. Робота завершується оцінкою компромісів між обчислювальною ефективністю та точністю виявлення, пропонуючи розуміння практичного впровадження контекстно-залежних систем комп'ютерного зору. | |
| dc.description.abstractother | The thesis contains 79 pages, 1 appendix, 31 images, and refers to 25 sources. This bachelor's thesis explores the development of an image analysis system that incorporates contextual understanding using modern deep learning techniques. The study begins with a review of classical feature descriptors and convolutional neural networks, then transitions into contemporary architectures such as visual transformers and hybrid models. Based on this analysis, an architecture combining Swin Transformer, Feature Pyramid Network (FPN), and Faster R-CNN was implemented to achieve accurate object detection with contextual awareness. The proposed solution emphasizes the importance of integrating both local and global features for robust scene understanding. To optimize performance on resource-constrained devices, the thesis also investigates model compression techniques, including linear attention, LoRA adaptation, pruning, and quantization. The final model was trained and tested on the COCO 2017 dataset using Python and PyTorch within Google Colab. Experimental results demonstrate that the model progressively improves detection accuracy with increased dataset size and training time. The work concludes with an evaluation of the trade-offs between computational efficiency and detection accuracy, offering insights into practical deployments of context-aware computer vision systems. | |
| dc.format.extent | 79 с. | |
| dc.identifier.citation | Обрядін, Д. В. Аналіз графічних зображень з урахуванням контексту за допомогою нейронних мереж : дипломна робота ... бакалавра : 113 Прикладна математика / Обрядін Денис Вадимович. – Київ, 2025. – 79 с. | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/74274 | |
| dc.language.iso | uk | |
| dc.publisher | КПІ ім. Ігоря Сікорського | |
| dc.publisher.place | Київ | |
| dc.subject | глибоке навчання | |
| dc.subject | аналіз зображень | |
| dc.subject | Swin Transformer | |
| dc.subject | виявлення об'єктів | |
| dc.subject | контекст | |
| dc.subject | CNN | |
| dc.subject | FPN | |
| dc.subject | Faster R-CNN | |
| dc.subject | оптимізація моделі | |
| dc.subject | deep learning | |
| dc.subject | image analysis | |
| dc.subject | Swin Transformer | |
| dc.subject | object detection | |
| dc.subject | context | |
| dc.subject | CNN | |
| dc.subject | FPN | |
| dc.subject | Faster R-CNN | |
| dc.subject | model optimization | |
| dc.title | Аналіз графічних зображень з урахуванням контексту за допомогою нейронних мереж | |
| dc.type | Bachelor Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Obryadin_bakalavr.pdf
- Розмір:
- 2.94 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: