Відкриті нейронні мережі в алгоритмах розпізнавання візуальної інформації для електронних систем безпеки

Вантажиться...
Ескіз

Дата

2025

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Переверзєв О.А. Відкриті нейронні мережі в алгоритмах розпізнавання візуальної інформації для електронних систем безпеки. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії у галузі знань 17 – Електроніка та телекомунікації за спеціальністю 171 – Електроніка. – Національний технічний університет України "Київський політехнічний інститут імені Ігоря Сікорського", Міністерство освіти і науки України, Київ, 2025. Дисертація присвячена аналізу та вдосконаленню сучасних алгоритмів розпізнавання візуальної інформації, що мають важливе практичне значення для забезпечення ефективності функціонування електронних систем безпеки. У дослідженні зосереджено увагу на інтеграції та удосконаленні алгоритмів глибинного навчання, серед яких обрано модель YOLOv7, спрямованих на розв’язання проблем, пов’язаних із низькою чіткістю зображення, шумом, оклюзією та змінним освітленням. Зміст дисертаційного дослідження викладено в трьох розділах, де представлено та обґрунтовано основні отримані результати роботи. Актуальність дисертаційної роботи обґрунтовано у вступі, де сформульовано мету та задачі дослідження, описано методи дослідження, надано інформацію про наукову новизну та практичне значення одержаних результатів. Перший розділ дисертаційного дослідження присвячено аналізу існуючих алгоритмів розпізнавання візуальної інформації, що використовуються в електронних системах безпеки. Розглянуто основні принципи та класифікацію алгоритмів виявлення і відстеження об’єктів, їх застосування у відеоспостереженні, військових системах та транспортних технологіях. Проаналізовано перспективні методи розпізнавання об’єктів, зокрема CAMShift, Optical Flow, для яких визначено переваги та недоліки при зміні умов освітлення, динаміці сцени та наявності шуму. Додатково досліджено підходи до розпізнавання тексту на зображеннях. У розділі також проведено порівняння традиційних алгоритмів із методами глибокого навчання. Визначено, що нейронні мережі демонструють вищу ефективність у порівнянні з традиційними способами, при роботі з візуальною інформацією в умовах часткового перекриття, змінного освітлення та складного фону, що підтверджує їхню доцільність для впровадження у системи відеоспостереження та безпеки. Отримані результати демонструють переваги використання адаптивних методів обробки відеопотоку та підходів до динамічного налаштування параметрів алгоритмів відстеження. Це дозволяє значно покращити продуктивність електронних систем безпеки в реальних умовах експлуатації та підвищити їх стійкість до зовнішніх перешкод. Другий розділ дисертаційного дослідження присвячено експериментальному аналізу алгоритмів виявлення, відстеження та обробки візуальної інформації у системах безпеки. Основний акцент зроблено на оцінці ефективності двох найбільш поширених алгоритмів CAMShift та Optical Flow для відстеження об’єктів у відеопотоці, а також на порівнянні їхньої продуктивності в умовах змінного освітлення, часткової оклюзії та шумових перешкод. Додатково у розділі розглянуто методи зменшення шуму на зображеннях шляхом використання згорткових нейронних мереж. Проведено аналіз підходів до фільтрації яскравісного шуму, що виникає внаслідок роботи світлочутливої матриці камери, та впливу при фіксації зображення зовнішніх факторів (туман, затемнення, забруднення камери). Також досліджено підходи до розпізнавання тексту на зображеннях за допомогою одного з виду вейвлет-перетворень, що дозволяє зменшити вплив фонових завад та підвищити точність обробки зображень у складних умовах. Важливу увагу приділено експериментальному порівнянню різних модифікацій YOLOv7, оцінці впливу змін у структурі нейромережі на точність виявлення та швидкість обробки відеопотоку. Проаналізовано ефективність додавання каскадних шарів та механізму уваги для покращення роботи нейромереж у складних сценах. У третьому розділі роботи зосереджено увагу на практичній реалізації та перевірці алгоритмів оцінки об’єктів на поверхні зображення з камери відеоспостереження на основі застосування моделі YOLO. Основна увага прикута дослідженню адаптації нейронних мереж до реальних умов експлуатації, створенню спеціалізованих датасетів і впровадженню моделей у системи відеоспостереження. Особливістю третього розділу є перевірка моделі YOLOv7 та розроблення її модифікації для використанні в системі відеоспостереження за складних оточуючих умов фіксації. Проведено серію експериментів, які включали аналіз відеопотоку в умовах різної прозорості середовища (імітація туману, забруднення камери), часткової оклюзії об’єктів і повної відсутності освітлення а також особливості роботи в інфрачервоному режимі. У дисертації представлено наступні наукові результати: 1. Вперше розроблено модифіковану систему розпізнавання зображень, яка дозволяє ідентифікувати об’єкти холодної зброї в інфрачервоному режимі та в умовах низької видимості. 2. Удосконалено роботу нейронної мережі згорткового типу, яка дозволяє при обробленні зображень зменшувати адитивний яскравісний шум зображення у випадку, коли сам рівень шуму може змінюватись в при аналізі секвенції зображень. 3. Удосконалено оптичну систему розпізнавання тексту, яка характеризується стійкістю до заважаючих фонових елементів у формі кривих Без’є. 4. Удосконалено архітектуру моделі YOLO V7 за рахунок додавання капсульного шару, внаслідок чого, знайдено вирішення проблеми обмеженого виявлення об'єктів за відстанню, у складних сценах із частковим перекриттям або зміною форми останніх а також в умовах зменшеної видимості об’єктів зображення за наявності або відсутності освітлення. Практичне значення отриманих результатів полягає у наступному. 1. Визначені рекомендації щодо оцінки моделей на основі YOLOv7 дозволяють удосконалити їхню роботу в умовах низького освітлення, зменшеної чіткості об’єктів та часткового перекриття, що є актуальним для систем, які працюють у складних умовах. 2. Отримані результати можуть бути інтегровані у прикладні рішення для автоматизованого виявлення зброї на інфрачервоних та оптичних зображеннях, що сприятиме у подальшому підвищенню рівня безпеки в громадських та стратегічно важливих об’єктах. 3. Запропоновані підходи до адаптації алгоритмів розпізнавання об'єктів можуть бути використані у військових системах, транспортних технологіях, інтелектуальних системах управління дорожнім рухом та інших галузях, де важливе своєчасне і точне розпізнавання об’єктів. 4. Практичні результати можуть знайти своє застосування у розробці програмного забезпечення для аналізу відеопотоку, орієнтованого на роботу з інфрачервоними камерами, що забезпечить можливість ефективного моніторингу в умовах поганої видимості.

Опис

Ключові слова

згортка, мультимедійна інформація, мережа, оцінка ефективності, контент, безпека, модель, шуми, моделювання, Інтернет речей, рівень сигналу, IoT, розповсюдження сигналу, оцінка, тестовий сигнал, зображення, convolution, multimedia information, network, performance evaluation, content, security, model, noise, modeling, Internet of Things, signal strength, signal propagation, evaluation, test signal, image

Бібліографічний опис

Переверзєв, О. А. Відкриті нейронні мережі в алгоритмах розпізнавання візуальної інформації для електронних систем безпеки : дис. … д-ра філософії : 171 Електроніка / Переверзєв Олексій Андрійович. – Київ, 2025. – 156 с.

ORCID

DOI