Відкриті нейронні мережі в алгоритмах розпізнавання візуальної інформації для електронних систем безпеки
dc.contributor.advisor | Трапезон, Кирило Олександрович | |
dc.contributor.author | Переверзєв, Олексій Андрійович | |
dc.date.accessioned | 2025-06-23T13:50:20Z | |
dc.date.available | 2025-06-23T13:50:20Z | |
dc.date.issued | 2025 | |
dc.description.abstract | Переверзєв О.А. Відкриті нейронні мережі в алгоритмах розпізнавання візуальної інформації для електронних систем безпеки. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії у галузі знань 17 – Електроніка та телекомунікації за спеціальністю 171 – Електроніка. – Національний технічний університет України "Київський політехнічний інститут імені Ігоря Сікорського", Міністерство освіти і науки України, Київ, 2025. Дисертація присвячена аналізу та вдосконаленню сучасних алгоритмів розпізнавання візуальної інформації, що мають важливе практичне значення для забезпечення ефективності функціонування електронних систем безпеки. У дослідженні зосереджено увагу на інтеграції та удосконаленні алгоритмів глибинного навчання, серед яких обрано модель YOLOv7, спрямованих на розв’язання проблем, пов’язаних із низькою чіткістю зображення, шумом, оклюзією та змінним освітленням. Зміст дисертаційного дослідження викладено в трьох розділах, де представлено та обґрунтовано основні отримані результати роботи. Актуальність дисертаційної роботи обґрунтовано у вступі, де сформульовано мету та задачі дослідження, описано методи дослідження, надано інформацію про наукову новизну та практичне значення одержаних результатів. Перший розділ дисертаційного дослідження присвячено аналізу існуючих алгоритмів розпізнавання візуальної інформації, що використовуються в електронних системах безпеки. Розглянуто основні принципи та класифікацію алгоритмів виявлення і відстеження об’єктів, їх застосування у відеоспостереженні, військових системах та транспортних технологіях. Проаналізовано перспективні методи розпізнавання об’єктів, зокрема CAMShift, Optical Flow, для яких визначено переваги та недоліки при зміні умов освітлення, динаміці сцени та наявності шуму. Додатково досліджено підходи до розпізнавання тексту на зображеннях. У розділі також проведено порівняння традиційних алгоритмів із методами глибокого навчання. Визначено, що нейронні мережі демонструють вищу ефективність у порівнянні з традиційними способами, при роботі з візуальною інформацією в умовах часткового перекриття, змінного освітлення та складного фону, що підтверджує їхню доцільність для впровадження у системи відеоспостереження та безпеки. Отримані результати демонструють переваги використання адаптивних методів обробки відеопотоку та підходів до динамічного налаштування параметрів алгоритмів відстеження. Це дозволяє значно покращити продуктивність електронних систем безпеки в реальних умовах експлуатації та підвищити їх стійкість до зовнішніх перешкод. Другий розділ дисертаційного дослідження присвячено експериментальному аналізу алгоритмів виявлення, відстеження та обробки візуальної інформації у системах безпеки. Основний акцент зроблено на оцінці ефективності двох найбільш поширених алгоритмів CAMShift та Optical Flow для відстеження об’єктів у відеопотоці, а також на порівнянні їхньої продуктивності в умовах змінного освітлення, часткової оклюзії та шумових перешкод. Додатково у розділі розглянуто методи зменшення шуму на зображеннях шляхом використання згорткових нейронних мереж. Проведено аналіз підходів до фільтрації яскравісного шуму, що виникає внаслідок роботи світлочутливої матриці камери, та впливу при фіксації зображення зовнішніх факторів (туман, затемнення, забруднення камери). Також досліджено підходи до розпізнавання тексту на зображеннях за допомогою одного з виду вейвлет-перетворень, що дозволяє зменшити вплив фонових завад та підвищити точність обробки зображень у складних умовах. Важливу увагу приділено експериментальному порівнянню різних модифікацій YOLOv7, оцінці впливу змін у структурі нейромережі на точність виявлення та швидкість обробки відеопотоку. Проаналізовано ефективність додавання каскадних шарів та механізму уваги для покращення роботи нейромереж у складних сценах. У третьому розділі роботи зосереджено увагу на практичній реалізації та перевірці алгоритмів оцінки об’єктів на поверхні зображення з камери відеоспостереження на основі застосування моделі YOLO. Основна увага прикута дослідженню адаптації нейронних мереж до реальних умов експлуатації, створенню спеціалізованих датасетів і впровадженню моделей у системи відеоспостереження. Особливістю третього розділу є перевірка моделі YOLOv7 та розроблення її модифікації для використанні в системі відеоспостереження за складних оточуючих умов фіксації. Проведено серію експериментів, які включали аналіз відеопотоку в умовах різної прозорості середовища (імітація туману, забруднення камери), часткової оклюзії об’єктів і повної відсутності освітлення а також особливості роботи в інфрачервоному режимі. У дисертації представлено наступні наукові результати: 1. Вперше розроблено модифіковану систему розпізнавання зображень, яка дозволяє ідентифікувати об’єкти холодної зброї в інфрачервоному режимі та в умовах низької видимості. 2. Удосконалено роботу нейронної мережі згорткового типу, яка дозволяє при обробленні зображень зменшувати адитивний яскравісний шум зображення у випадку, коли сам рівень шуму може змінюватись в при аналізі секвенції зображень. 3. Удосконалено оптичну систему розпізнавання тексту, яка характеризується стійкістю до заважаючих фонових елементів у формі кривих Без’є. 4. Удосконалено архітектуру моделі YOLO V7 за рахунок додавання капсульного шару, внаслідок чого, знайдено вирішення проблеми обмеженого виявлення об'єктів за відстанню, у складних сценах із частковим перекриттям або зміною форми останніх а також в умовах зменшеної видимості об’єктів зображення за наявності або відсутності освітлення. Практичне значення отриманих результатів полягає у наступному. 1. Визначені рекомендації щодо оцінки моделей на основі YOLOv7 дозволяють удосконалити їхню роботу в умовах низького освітлення, зменшеної чіткості об’єктів та часткового перекриття, що є актуальним для систем, які працюють у складних умовах. 2. Отримані результати можуть бути інтегровані у прикладні рішення для автоматизованого виявлення зброї на інфрачервоних та оптичних зображеннях, що сприятиме у подальшому підвищенню рівня безпеки в громадських та стратегічно важливих об’єктах. 3. Запропоновані підходи до адаптації алгоритмів розпізнавання об'єктів можуть бути використані у військових системах, транспортних технологіях, інтелектуальних системах управління дорожнім рухом та інших галузях, де важливе своєчасне і точне розпізнавання об’єктів. 4. Практичні результати можуть знайти своє застосування у розробці програмного забезпечення для аналізу відеопотоку, орієнтованого на роботу з інфрачервоними камерами, що забезпечить можливість ефективного моніторингу в умовах поганої видимості. | |
dc.description.abstractother | Pereverziev O.A. Open neural networks in visual information recognition algorithms for electronic security systems. – A qualification scientific work as a manuscript. Dissertation for the degree of Doctor of Philosophy in the field of knowledge 17 – Electronics and Telecommunications, specialty 171 – Electronics. – National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute", Ministry of Education and Science of Ukraine, Kyiv, 2025. The dissertation is devoted to the analysis and improvement of modern visual information recognition algorithms that are of great practical importance for ensuring the efficiency of electronic security systems. The research focuses on the integration of deep learning algorithms, such as YOLOv7, into image and video stream analysis processes, as well as on solving problems associated with low image clarity, noise, occlusion, and variable lighting. The content of the dissertation research is outlined in three chapters, where the main results of the work are presented and substantiated. The relevance of the dissertation is substantiated in the introduction, which formulates the purpose and objectives of the study, describes the research methods, and provides information on the scientific novelty and practical significance of the results. The first chapter of the dissertation is devoted to the analysis of visual information recognition algorithms used in electronic security systems. The basic principles and classification of object detection and tracking algorithms, their application in video surveillance, military systems and transport technologies are considered. Traditional methods of object recognition, such as CAMShift and Optical Flow, are analysed, as well as their advantages and disadvantages in changing lighting conditions, scene dynamics and noise. Additionally, approaches to text recognition in images are investigated. The chapter also compares traditional algorithms with deep learning methods. It is determined that neural networks demonstrate higher efficiency when working in conditions of partial overlap, variable lighting and complex backgrounds, which confirms their feasibility for implementation in video surveillance and security systems. The obtained results demonstrate the advantages of using adaptive video stream processing methods and approaches to dynamically adjusting the parameters of tracking algorithms. This can significantly improve the performance of electronic security systems in real-world conditions and increase their resistance to external interference. The second chapter of the dissertation is devoted to the experimental analysis of algorithms for detecting, tracking and processing visual information in security systems. The main focus is on evaluating the effectiveness of CAMShift and Optical Flow algorithms for tracking objects in a video stream, as well as comparing their performance under conditions of variable lighting, partial occlusion, and noise interference. Additionally, the chapter discusses methods for reducing noise in images using convolutional neural networks. The approaches to filtering luminance noise arising from poor video stream quality and the influence of external factors (fog, blackout, camera contamination) are analysed. Approaches to text recognition in images using wavelet transforms are also investigated, which reduces the influence of background noise and increases the accuracy of image processing in difficult conditions. Important attention is paid to the experimental comparison of various modifications of YOLOv7, assessing the impact of changes in the structure of the neural network on the detection accuracy and processing speed of the video stream. The effectiveness of adding cascade layers and an attention mechanism to improve neural network performance in complex scenes is analysed. The third section of the paper focuses on the practical implementation and verification of algorithms for estimating objects on the surface of a video surveillance camera image based on the YOLO model. The main focus is on the adaptation of neural networks to real operating conditions, the creation of specialised datasets and the implementation of models in video surveillance systems. The third chapter is dedicated to the adaptation of software to work with the modified YOLOv7 model. The peculiarities of integrating a neural network into a video surveillance system are covered in detail. The study also covers the analysis of methods for improving the accuracy of neural networks when working with a video stream in difficult conditions. Particular attention is paid to the adaptation of convolutional neural networks to reduce the additive luminance noise that occurs during the processing of dynamic video. Formation of specialised datasets for training YOLOv7, which take into account the factors of partial occlusion, dynamic background and variable image quality. A series of experiments were conducted, including analysis of the video stream in conditions of different environmental transparency (fog simulation, camera contamination), partial occlusion of objects and complete absence of lighting, as well as features of work in the infrared mode. The dissertation presents the following scientific results: 1. Probably for the first time, a modified image recognition system has been developed that allows the identification of weapons in infrared and in extremely poor visibility conditions. 2. The work of the convolutional neural network has been improved, which allows to reduce the additive luminance noise of the image in the case when the noise level itself can change during the analysis of the image sequence. 3. An improved optical text recognition system characterized by resistance to interfering background elements in the form of Bezier curves. 4. The architecture of the YOLO V7 model has been improved by adding a capsule layer after the neck module, which solved the problem of detecting objects in complex scenes with partial overlap or change in shape of the latter, as well as in conditions of reduced visibility of image objects in the presence and absence of lighting. The practical significance of the obtained results includes the following: 1. The defined parameters and recommendations for the use of models based on YOLOv7 allow to improve their performance in low light conditions, reduced object clarity and partial overlap, which is relevant for systems operating in difficult conditions. 2. The obtained results can be integrated into applied solutions for automated weapon detection on infrared and optical images, which will help to increase the level of security in public and strategically important facilities. 3. The proposed approaches to the adaptation of object recognition algorithms can be used in military systems, transportation technologies, intelligent traffic management systems, and other areas where timely and accurate object recognition is important. 4. Practical results can be applied in the development of video stream analysis software focused on working with infrared cameras, which will provide the possibility of effective monitoring in low visibility conditions. | |
dc.format.extent | 156 с. | |
dc.identifier.citation | Переверзєв, О. А. Відкриті нейронні мережі в алгоритмах розпізнавання візуальної інформації для електронних систем безпеки : дис. … д-ра філософії : 171 Електроніка / Переверзєв Олексій Андрійович. – Київ, 2025. – 156 с. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/74381 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | згортка | |
dc.subject | мультимедійна інформація | |
dc.subject | мережа | |
dc.subject | оцінка ефективності | |
dc.subject | контент | |
dc.subject | безпека | |
dc.subject | модель | |
dc.subject | шуми | |
dc.subject | моделювання | |
dc.subject | Інтернет речей | |
dc.subject | рівень сигналу | |
dc.subject | IoT | |
dc.subject | розповсюдження сигналу | |
dc.subject | оцінка | |
dc.subject | тестовий сигнал | |
dc.subject | зображення | |
dc.subject | convolution | |
dc.subject | multimedia information | |
dc.subject | network | |
dc.subject | performance evaluation | |
dc.subject | content | |
dc.subject | security | |
dc.subject | model | |
dc.subject | noise | |
dc.subject | modeling | |
dc.subject | Internet of Things | |
dc.subject | signal strength | |
dc.subject | signal propagation | |
dc.subject | evaluation | |
dc.subject | test signal | |
dc.subject | image | |
dc.subject.udc | 621.391.83 | |
dc.title | Відкриті нейронні мережі в алгоритмах розпізнавання візуальної інформації для електронних систем безпеки | |
dc.type | Thesis Doctoral |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Pereverziev_dys.pdf
- Розмір:
- 3.7 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: