Відеоспостереження на базі WebRTC з розпізнаванням облич

Вантажиться...
Ескіз

Дата

2025

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Актуальність теми. Актуальність проєкту зумовлена зростаючою потребою у доступних і надійних технологіях контролю доступу, відеоспостереження та автоматичної ідентифікації користувачів. Мета роботи. Створення програмної системи розпізнавання облич у реальному часі з використанням WebRTC та нейромережевих методів комп’ютерного зору, а також проведення порівняльного аналізу її точності та продуктивності відносно класичних алгоритмічних методів. Завдання дослідження: Завдання які покладаються на цю роботу наступні: дослідити сучасні методи й моделі для розпізнавання облич; проаналізувати алгоритмічні та нейромережеві підходи; розробити архітектуру програмного забезпечення; створити модулі детекції, embedding та ідентифікації облич; реалізувати передачу відеопотоку за допомогою WebRTC; розробити базу даних користувачів та журнал подій; провести експериментальне дослідження продуктивності та точності; виконати порівняння роботи алгоритмічного та DNN-підходів. Об’єкт дослідження — процес розпізнавання облич у системах відеоаналітики реального часу. Предмет дослідження — методи та програмні засоби нейромережевого розпізнавання облич при передачі відеопотоку через WebRTC. Методи дослідження: у роботі використано системний аналіз (для дослідження архітектур та методів розпізнавання облич), методи комп’ютерного зору (для детекції та нормалізації зображень), нейромережеві методи (для побудови embedding-векторів та оцінки подібності), об’єктно-орієнтоване проектування (для розробки клієнт–серверної архітектури системи), статистичні методи (для аналізу точності, FPS та впливу порогу розпізнавання), а також методи порівняльного аналізу (для оцінки переваг DNN над алгоритмічними підходами HOG+SVM). Наукова новизна: вдосконалення підходу до веборієнтованого розпізнавання облич шляхом інтеграції технології WebRTC з нейромережевими моделями SSD ResNet-10 та OpenFace у єдину клієнт–серверну систему реального часу. На відміну від існуючих рішень, які зазвичай потребують спеціалізованого програмного забезпечення або локальної обробки, запропонований підхід забезпечує низьку затримку, високу точність розпізнавання та можливість роботи безпосередньо в браузері. Система також поєднує потокову передачу відеоданих, серверну DNN-обробку та векторну ідентифікацію, що розширює можливості застосування обличчевої біометрії у вебсередовищі. Практичне значення: створення функціональної системи, здатної виконувати розпізнавання облич у реальному часі зі швидкістю 15–22 FPS та точністю 93–97%. Розроблена технологія може бути інтегрована у системи контролю доступу, відеоаналітики, онлайн-ідентифікації, корпоративні вебпортали та освітні платформи. Створений стартап-проєкт FacePass Cloud демонструє можливість комерціалізації розробки, пропонуючи масштабоване хмарне рішення для розпізнавання облич, яке може застосовуватися у фінансових, логістичних, сервісних та безпекових сферах. Апробація результатів дисертації. Основні положення роботи доповідались на 2-й Міжнародній науково-практичній конференції «Прогресивні підходи в науці та техніці» (Progressive Approaches in Science and Engineering), м. Копенгаген, Данія, 2025 р., секція «Інформаційні технології та кібербезпека». Дисертація складається зі вступу, п'яти розділів та висновків. Повний обсяг дисертації складає 125 сторінок, в тому числі 104 сторінок основного тексту, 32 таблиць, 18 рисунків, 3 сторінки списку використаних джерел у кількості 40 найменувань.

Опис

Розроблений програмний продукт являє собою веборієнтовану систему розпізнавання облич у реальному часі, призначену для автоматизованої ідентифікації користувачів на основі відеопотоку з браузера. Система реалізує повний цикл обробки: захоплення відео через WebRTC, детекцію облич за допомогою нейронної мережі SSD ResNet-10, формування векторних ознак (embeddings) моделлю OpenFace та порівняння їх з базою зареєстрованих користувачів. Архітектура побудована за модульним принципом та включає клієнтську частину на JavaScript з використанням WebRTC, серверну частину на Python (aiohttp, aiortc), модуль нейромережевої обробки на OpenCV DNN, а також реляційну базу даних SQLite для зберігання користувачів, embeddings та журналу подій. Комунікація між клієнтом і сервером реалізована через Socket.IO, що забезпечує низьку затримку та двосторонній обмін даними. Система підтримує два основних режими роботи: розпізнавання користувачів у реальному часі та реєстрацію нових облич (enroll) із формуванням ембеддингів. Експериментальні дослідження підтвердили стабільну роботу в браузері зі швидкістю 15–22 FPS, затримкою 80–120 мс і точністю розпізнавання 93–97% при оптимальному порозі 0.55–0.60.

Ключові слова

розпізнавання облич, WebRTC, нейронні мережі, OpenFace, SSD ResNet-10, комп’ютерний зір, відеоаналітика, реальний час, Socket.IO, embedding-вектор, face recognition, WebRTC, neural networks, OpenFace, SSD ResNet10, computer vision, video analytics, real-time processing, Socket.IO, embedding vector

Бібліографічний опис

Пінчук, М. Л. Відеоспостереження на базі WebRTC з розпізнаванням облич : магістерська дис. : 122 Комп’ютерні науки / Пінчук Максим Леонідович. – Київ, 2025. – 125 с.

ORCID

DOI