Спосіб розпізнавання поведінкових патернів на основі попередньо відомих образів
| dc.contributor.advisor | Сергієнко, Павло Анатолійович | |
| dc.contributor.author | Філіпенко, Данило Олександрович | |
| dc.date.accessioned | 2026-01-19T10:23:46Z | |
| dc.date.available | 2026-01-19T10:23:46Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Актуальність теми. Актуальність теми дослідження зумовлена швидким розвитком систем комп’ютерного зору та зростанням попиту на автоматизоване розпізнавання поведінкових патернів у відеопотоці в реальному часі. Широке застосування таких систем у відеоспостереженні, аналізі спортивних змагань, охороні здоров’я, інтелектуальних транспортних системах та моніторингу безпеки вимагає високої точності, стійкості до оклюзій, узагальнювальної здатності та ефективності обробки в умовах обмежених ресурсів. Метою даного дослідження є розробка та вдосконалення способу розпізнавання поведінкових патернів на основі інтеграції детекції, трекінгу та класифікації дій з використанням сучасних методів глибокого навчання для досягнення високої точності та стійкості в реальних умовах. Об’єктом дослідження є процеси розпізнавання поведінкових патернів у відеопотоці. Предметом дослідження є методи та архітектури глибокого навчання для детекції об’єктів, трекінгу та класифікації дій, зокрема інтеграція механізмів уваги, графових нейронних мереж, зовнішньої пам’яті, адаптації доменів та оцінки пози. Наукова новизна полягає в наступному: 1. Запропоновано удосконалений спосіб розпізнавання поведінкових патернів у відеопослідовностях, що ґрунтується на інтеграції детекції, мультіоб’єктного трекінгу та часової класифікації дій у єдину модульну систему на основі сучасних методів глибокого навчання. Розроблено удосконалений ReID-модуль для алгоритму DeepSORT із використанням механізму тимчасової уваги, що забезпечує підвищення стійкості трекінгу до оклюзій та зменшення кількості перемикань ідентифікаторів об’єктів. Запропоновано модуль динамічного мультіоб’єктного трекінгу на основі графових нейронних мереж, який підвищує точність асоціації об’єктів у складних відеосценах при збереженні продуктивності в режимі реального часу. Розроблено пам’яттєво-розширену архітектуру рекурентної нейронної мережі для моделювання довготривалих поведінкових залежностей, що дозволяє підвищити точність класифікації дій у тривалих та складних відеопослідовностях. Запропоновано підхід до доменної адаптації на основі шару обертання градієнтів та гібридне формування ознак, яке поєднує траєкторні та позові характеристики, що забезпечує підвищення узагальнювальної здатності моделі на різних типах відеоданих. Практична цінність отриманих у роботі результатів полягає в тому, що розроблений спосіб розпізнавання поведінкових патернів був реалізований та перевірений у складі веб-застосунку, який забезпечує стабільну роботу в режимі реального часу. Запропонована система може бути використана для задач відеоспостереження, спортивного аналізу, медичного моніторингу, аналізу людської активності та виявлення потенційно небезпечної або аномальної поведінки. Розроблена модульна архітектура дозволяє інтегрувати систему з існуючими відеопотоками та масштабувати її для використання у складних реальних умовах, включаючи вуличні сцени з оклюзіями та великою кількістю об’єктів. Отримані в роботі рішення можуть слугувати основою для подальшого розвитку інтелектуальних відеоаналітичних систем, зокрема шляхом розширення на мультимодальні дані, вбудовані платформи та задачі виявлення аномальної поведінки. Апробація результатів роботи Положення даної роботи та проміжні результати доповідались і обговорювались на наступних конференціях: 1. Прикладна математика та комп'ютинг 2025, м. Київ, 2025. 2. Proceedings of the 4th International scientific and practical conference. BoScience Publisher. Chicago, USA. Публікації 1. Сергієнко П. А., Філіпенко Д. О. Спосіб розпізнавання поведінкових патернів на основі попередньо відомих образів// International experience in scientific research. Proceedings of the 4th International scientific and practical conference. BoScience Publisher. Чикаго, USA. 2025. – С. 243 – 245. URL:https://sci-conf.com.ua/iv-mizhnarodna-naukovo-praktichna-konferentsiya-international-experience-in-scientific-research-20-22-11-2025-chikago-ssha-arhiv/. 2. Сергієнко П. А., Філіпенко Д. О. Спосіб розпізнавання поведінкових патернів на основі попередньо відомих образів // Прикладна математика та комп'ютинг 2025. – Київ. ПМК-2025. – С. 285 – 289 Структура та обсяг роботи. Магістерська дисертація складається з вступу, трьох розділів, висновків до кожного розділу та загальних висновків по роботі в цілому, списку використаних літературних джерел. У вступі подано загальну характеристику роботи, описано сучасний стан проблеми, обґрунтовано актуальність теми дослідження, сформульовано мету та задачі роботи, а також наведено відомості про наукову новизну та практичну цінність отриманих результатів. У першому розділі розглянуто огляд сучасних методів детекції, трекінгу та класифікації дій у відеопотоці, проаналізовано набори даних UCF101, NTU RGB+D та MOT17. У другому розділі представлено базову систему на основі YOLOv8n, DeepSORT та LSTM з оцінкою ефективності на контрольованих наборах. У третьому розділі розроблено та реалізовано вдосконалення: механізм уваги в ReUD, графові нейронні мережі для трекінгу, інтеграцію зовнішньої пам’яті, адаптацію доменів, комбінування ознак за допомогою MediaPipe. У висновках підсумовано результати проведеної роботи. У роботі представлено 11 таблиць, 24 рисунків, список використаних літературних джерел (39 найменувань), 14 слайдів презентації. | |
| dc.description.abstractother | Topic relevance. The relevance of this research topic is driven by the rapid development of computer vision systems and the growing demand for automated real-time recognition of behavioral patterns in video streams. The widespread application of such systems in video surveillance, sports analytics, healthcare, intelligent transportation systems, and security monitoring requires high accuracy, robustness to occlusions, strong generalization capability, and computational efficiency under limited resource constraints. The purpose of this research is to develop and improve a method for behavioral pattern recognition based on the integration of object detection, tracking, and action classification using modern deep learning techniques, in order to achieve high accuracy and robustness under real-world conditions. The object of the research is the process of behavioral pattern recognition in video streams. The subject of the research includes deep learning methods and architectures for object detection, tracking, and action classification, in particular the integration of attention mechanisms, graph neural networks, external memory, domain adaptation, and pose estimation. The scientific novelty is as follows: An improved method for behavioral pattern recognition in video sequences is proposed, based on the integration of detection, multi-object tracking, and temporal action classification into a unified modular system using state-of-the-art deep learning approaches. An enhanced ReID module for the DeepSORT algorithm incorporating a temporal attention mechanism is developed, which increases tracking robustness to occlusions and reduces the number of identity switches. A dynamic multi-object tracking module based on graph neural networks is proposed, improving object association accuracy in complex video scenes while maintaining real-time performance. A memory-augmented recurrent neural network architecture is developed to model long-term behavioral dependencies, enabling higher action classification accuracy in long and complex video sequences. A domain adaptation approach based on a gradient reversal layer and a hybrid feature representation combining trajectory-based and pose-based features is proposed, which improves the generalization capability of the model across different types of video data. The practical significance of the obtained results lies in the fact that the developed behavioral pattern recognition method has been implemented and validated within a web-based application that ensures stable real-time operation. The proposed system can be applied to video surveillance, sports analytics, medical monitoring, human activity analysis, and the detection of potentially dangerous or anomalous behavior. The modular architecture enables integration with existing video streams and scalability for deployment in complex real-world environments, including outdoor scenes with occlusions and high object density. The obtained results may serve as a foundation for further development of intelligent video analytics systems, particularly through extension to multimodal data, embedded platforms, and anomaly detection tasks. Approbation of research results. The main provisions of this work and intermediate results were presented and discussed at the following conferences: 1. Applied Mathematics and Computing 2025, Kyiv, Ukraine, 2025. 2. Proceedings of the 4th International Scientific and Practical Conference, BoScience Publisher, Chicago, USA. Publications 1. Sergiienko P. A., Filipenko D. O. A method for behavioral pattern recognition based on predefined visual templates // International Experience in Scientific Research. Proceedings of the 4th International Scientific and Practical Conference. BoScience Publisher, Chicago, USA, 2025, pp. 243–245. URL: https://sci-conf.com.ua/iv-mizhnarodna-naukovo-praktichna-konferentsiya-international-experience-in-scientific-research-20-22-11-2025-chikago-ssha-arhiv/ 2. Sergiienko P. A., Filipenko D. O. A method for behavioral pattern recognition based on predefined visual templates // Applied Mathematics and Computing 2025. Kyiv, AMC-2025, pp. 285–289. Structure and scope of work. The master’s thesis consists of an introduction, three chapters, conclusions for each chapter, general conclusions, and a list of references. The introduction presents a general overview of the research, describes the current state of the problem, justifies the relevance of the topic, formulates the aim and objectives of the study, and outlines the scientific novelty and practical significance of the obtained results. Chapter 1 provides a review of modern methods for object detection, tracking, and action classification in video streams, and analyzes the UCF101, NTU RGB+D, and MOT17 datasets. Chapter 2 presents a baseline system based on YOLOv8n, DeepSORT, and LSTM, along with an evaluation of its performance on controlled datasets. Chapter 3 describes the proposed improvements, including an attention mechanism in the ReID module, graph neural networks for tracking, external memory integration, domain adaptation, and feature fusion using MediaPipe. The conclusions summarize the results of the conducted research. The thesis includes 11 tables, 24 figures, a list of references comprising 39 sources, and 14 presentation slides. | |
| dc.format.extent | 122 с. | |
| dc.identifier.citation | Філіпенко, Д. О. Спосіб розпізнавання поведінкових патернів на основі попередньо відомих образів : магістерська дис. : 123 Комп'ютерна інженерія / Філіпенко Данило Олександрович. – Київ, 2025. – 122 с. | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/78206 | |
| dc.language.iso | uk | |
| dc.publisher | КПІ ім. Ігоря Сікорського | |
| dc.publisher.place | Київ | |
| dc.subject | розпізнавання дій | |
| dc.subject | детекція об’єктів | |
| dc.subject | трекінг | |
| dc.subject | глибоке навчання | |
| dc.subject | механізм уваги | |
| dc.subject | графові нейронні мережі | |
| dc.subject | адаптація доменів | |
| dc.subject | оцінка пози | |
| dc.subject | веб-додаток. | |
| dc.subject | action recognition | |
| dc.subject | object detection | |
| dc.subject | tracking | |
| dc.subject | deep learning | |
| dc.subject | attention mechanism | |
| dc.subject | graph neural networks | |
| dc.subject | domain adaptation | |
| dc.subject | pose estimation | |
| dc.subject | web application. | |
| dc.subject.udc | 004.93’1 | |
| dc.title | Спосіб розпізнавання поведінкових патернів на основі попередньо відомих образів | |
| dc.type | Master Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Filipenko_magistr.pdf
- Розмір:
- 14.16 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: