Відеоспостереження на базі WebRTC з розпізнаванням облич
| dc.contributor.advisor | Аушева, Наталія Миколаївна | |
| dc.contributor.author | Пінчук, Максим Леонідович | |
| dc.date.accessioned | 2026-01-30T10:31:56Z | |
| dc.date.available | 2026-01-30T10:31:56Z | |
| dc.date.issued | 2025 | |
| dc.description | Розроблений програмний продукт являє собою веборієнтовану систему розпізнавання облич у реальному часі, призначену для автоматизованої ідентифікації користувачів на основі відеопотоку з браузера. Система реалізує повний цикл обробки: захоплення відео через WebRTC, детекцію облич за допомогою нейронної мережі SSD ResNet-10, формування векторних ознак (embeddings) моделлю OpenFace та порівняння їх з базою зареєстрованих користувачів. Архітектура побудована за модульним принципом та включає клієнтську частину на JavaScript з використанням WebRTC, серверну частину на Python (aiohttp, aiortc), модуль нейромережевої обробки на OpenCV DNN, а також реляційну базу даних SQLite для зберігання користувачів, embeddings та журналу подій. Комунікація між клієнтом і сервером реалізована через Socket.IO, що забезпечує низьку затримку та двосторонній обмін даними. Система підтримує два основних режими роботи: розпізнавання користувачів у реальному часі та реєстрацію нових облич (enroll) із формуванням ембеддингів. Експериментальні дослідження підтвердили стабільну роботу в браузері зі швидкістю 15–22 FPS, затримкою 80–120 мс і точністю розпізнавання 93–97% при оптимальному порозі 0.55–0.60. | |
| dc.description.abstract | Актуальність теми. Актуальність проєкту зумовлена зростаючою потребою у доступних і надійних технологіях контролю доступу, відеоспостереження та автоматичної ідентифікації користувачів. Мета роботи. Створення програмної системи розпізнавання облич у реальному часі з використанням WebRTC та нейромережевих методів комп’ютерного зору, а також проведення порівняльного аналізу її точності та продуктивності відносно класичних алгоритмічних методів. Завдання дослідження: Завдання які покладаються на цю роботу наступні: дослідити сучасні методи й моделі для розпізнавання облич; проаналізувати алгоритмічні та нейромережеві підходи; розробити архітектуру програмного забезпечення; створити модулі детекції, embedding та ідентифікації облич; реалізувати передачу відеопотоку за допомогою WebRTC; розробити базу даних користувачів та журнал подій; провести експериментальне дослідження продуктивності та точності; виконати порівняння роботи алгоритмічного та DNN-підходів. Об’єкт дослідження — процес розпізнавання облич у системах відеоаналітики реального часу. Предмет дослідження — методи та програмні засоби нейромережевого розпізнавання облич при передачі відеопотоку через WebRTC. Методи дослідження: у роботі використано системний аналіз (для дослідження архітектур та методів розпізнавання облич), методи комп’ютерного зору (для детекції та нормалізації зображень), нейромережеві методи (для побудови embedding-векторів та оцінки подібності), об’єктно-орієнтоване проектування (для розробки клієнт–серверної архітектури системи), статистичні методи (для аналізу точності, FPS та впливу порогу розпізнавання), а також методи порівняльного аналізу (для оцінки переваг DNN над алгоритмічними підходами HOG+SVM). Наукова новизна: вдосконалення підходу до веборієнтованого розпізнавання облич шляхом інтеграції технології WebRTC з нейромережевими моделями SSD ResNet-10 та OpenFace у єдину клієнт–серверну систему реального часу. На відміну від існуючих рішень, які зазвичай потребують спеціалізованого програмного забезпечення або локальної обробки, запропонований підхід забезпечує низьку затримку, високу точність розпізнавання та можливість роботи безпосередньо в браузері. Система також поєднує потокову передачу відеоданих, серверну DNN-обробку та векторну ідентифікацію, що розширює можливості застосування обличчевої біометрії у вебсередовищі. Практичне значення: створення функціональної системи, здатної виконувати розпізнавання облич у реальному часі зі швидкістю 15–22 FPS та точністю 93–97%. Розроблена технологія може бути інтегрована у системи контролю доступу, відеоаналітики, онлайн-ідентифікації, корпоративні вебпортали та освітні платформи. Створений стартап-проєкт FacePass Cloud демонструє можливість комерціалізації розробки, пропонуючи масштабоване хмарне рішення для розпізнавання облич, яке може застосовуватися у фінансових, логістичних, сервісних та безпекових сферах. Апробація результатів дисертації. Основні положення роботи доповідались на 2-й Міжнародній науково-практичній конференції «Прогресивні підходи в науці та техніці» (Progressive Approaches in Science and Engineering), м. Копенгаген, Данія, 2025 р., секція «Інформаційні технології та кібербезпека». Дисертація складається зі вступу, п'яти розділів та висновків. Повний обсяг дисертації складає 125 сторінок, в тому числі 104 сторінок основного тексту, 32 таблиць, 18 рисунків, 3 сторінки списку використаних джерел у кількості 40 найменувань. | |
| dc.description.abstractother | Relevance. The relevance of the project is driven by the growing demand for accessible and reliable technologies in access control, video surveillance, and automatic user identification. The aim of the research. The purpose of this work is to develop a real-time facial recognition software system using WebRTC and neural network–based computer vision methods, as well as to conduct a comparative analysis of its accuracy and performance relative to classical algorithmic approaches. Research tasks: The research objectives include: studying modern methods and models for facial recognition; analysing algorithmic and neural network approaches; designing the architecture of the software system; implementing modules for face detection, embedding generation, and identification; enabling video transmission using WebRTC; developing a user database and event logging system; conducting experimental evaluation of system performance and accuracy; and comparing the results of algorithmic and DNN-based approaches. Object of research —is the process of facial recognition in real-time video analytics systems. Subject of research — is the methods and software tools for neural-network-based facial recognition during video transmission via WebRTC. Research methods: the work employs systems analysis (to study architectures and facial recognition methods), computer vision methods (for detection and preprocessing of facial images), neural network techniques (for embedding generation and similarity assessment), object-oriented design (for developing the client–server architecture), statistical methods (for analysing accuracy, FPS, and threshold effects), and comparative analysis (for evaluating the advantages of DNNs over algorithmic approaches such as HOG+SVM). Scientific novelty: the scientific novelty lies in improving the approach to web-based facial recognition by integrating WebRTC technology with neural network models SSD ResNet-10 and OpenFace into a unified real-time client–server system. Unlike existing solutions that typically require specialised software or local processing, the proposed approach provides low latency, high recognition accuracy, and operation directly in the browser. The system combines streaming video transmission, server-side DNN processing, and vector-based identification, expanding the applicability of facial biometrics in web environments. Practical value: the practical significance of the work lies in the creation of a functional WebRTC system capable of performing real-time facial recognition at 15–22 FPS with an accuracy of 93–97%. The developed technology can be integrated into access control systems, video analytics platforms, online identification services, corporate web portals, and educational tools. The accompanying startup project, FacePass Cloud, demonstrates the potential for commercialisation by offering a scalable cloud-based facial recognition solution suitable for financial, logistics, service, and security sectors. Approbation of the results. The main results of the dissertation were presented at the 2nd International Scientific and Practical Conference “Progressive Approaches in Science and Engineering”, Copenhagen, Denmark, 2025, in the section “Information Technologies and Cybersecurity”. The thesis consists of an introduction, five chapters, and conclusions. The total volume of the thesis is 125 pages, including 104 pages of the main text, 32 tables, 18 figures, 3 pages of references comprising 40 titles. | |
| dc.format.extent | 125 с. | |
| dc.identifier.citation | Пінчук, М. Л. Відеоспостереження на базі WebRTC з розпізнаванням облич : магістерська дис. : 122 Комп’ютерні науки / Пінчук Максим Леонідович. – Київ, 2025. – 125 с. | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/78565 | |
| dc.language.iso | uk | |
| dc.publisher | КПІ ім. Ігоря Сікорського | |
| dc.publisher.place | Київ | |
| dc.subject | розпізнавання облич | |
| dc.subject | WebRTC | |
| dc.subject | нейронні мережі | |
| dc.subject | OpenFace | |
| dc.subject | SSD ResNet-10 | |
| dc.subject | комп’ютерний зір | |
| dc.subject | відеоаналітика | |
| dc.subject | реальний час | |
| dc.subject | Socket.IO | |
| dc.subject | embedding-вектор | |
| dc.subject | face recognition | |
| dc.subject | WebRTC | |
| dc.subject | neural networks | |
| dc.subject | OpenFace | |
| dc.subject | SSD ResNet10 | |
| dc.subject | computer vision | |
| dc.subject | video analytics | |
| dc.subject | real-time processing | |
| dc.subject | Socket.IO | |
| dc.subject | embedding vector | |
| dc.title | Відеоспостереження на базі WebRTC з розпізнаванням облич | |
| dc.title.alternative | Computer monitoring and geometric modeling of processes and systems | |
| dc.type | Master Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Pinchuk_magistr.pdf
- Розмір:
- 1.38 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: