Спосіб розпізнавання поведінкових патернів на основі попередньо відомих образів

Вантажиться...
Ескіз

Дата

2025

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Актуальність теми. Актуальність теми дослідження зумовлена швидким розвитком систем комп’ютерного зору та зростанням попиту на автоматизоване розпізнавання поведінкових патернів у відеопотоці в реальному часі. Широке застосування таких систем у відеоспостереженні, аналізі спортивних змагань, охороні здоров’я, інтелектуальних транспортних системах та моніторингу безпеки вимагає високої точності, стійкості до оклюзій, узагальнювальної здатності та ефективності обробки в умовах обмежених ресурсів. Метою даного дослідження є розробка та вдосконалення способу розпізнавання поведінкових патернів на основі інтеграції детекції, трекінгу та класифікації дій з використанням сучасних методів глибокого навчання для досягнення високої точності та стійкості в реальних умовах. Об’єктом дослідження є процеси розпізнавання поведінкових патернів у відеопотоці. Предметом дослідження є методи та архітектури глибокого навчання для детекції об’єктів, трекінгу та класифікації дій, зокрема інтеграція механізмів уваги, графових нейронних мереж, зовнішньої пам’яті, адаптації доменів та оцінки пози. Наукова новизна полягає в наступному: 1. Запропоновано удосконалений спосіб розпізнавання поведінкових патернів у відеопослідовностях, що ґрунтується на інтеграції детекції, мультіоб’єктного трекінгу та часової класифікації дій у єдину модульну систему на основі сучасних методів глибокого навчання. Розроблено удосконалений ReID-модуль для алгоритму DeepSORT із використанням механізму тимчасової уваги, що забезпечує підвищення стійкості трекінгу до оклюзій та зменшення кількості перемикань ідентифікаторів об’єктів. Запропоновано модуль динамічного мультіоб’єктного трекінгу на основі графових нейронних мереж, який підвищує точність асоціації об’єктів у складних відеосценах при збереженні продуктивності в режимі реального часу. Розроблено пам’яттєво-розширену архітектуру рекурентної нейронної мережі для моделювання довготривалих поведінкових залежностей, що дозволяє підвищити точність класифікації дій у тривалих та складних відеопослідовностях. Запропоновано підхід до доменної адаптації на основі шару обертання градієнтів та гібридне формування ознак, яке поєднує траєкторні та позові характеристики, що забезпечує підвищення узагальнювальної здатності моделі на різних типах відеоданих. Практична цінність отриманих у роботі результатів полягає в тому, що розроблений спосіб розпізнавання поведінкових патернів був реалізований та перевірений у складі веб-застосунку, який забезпечує стабільну роботу в режимі реального часу. Запропонована система може бути використана для задач відеоспостереження, спортивного аналізу, медичного моніторингу, аналізу людської активності та виявлення потенційно небезпечної або аномальної поведінки. Розроблена модульна архітектура дозволяє інтегрувати систему з існуючими відеопотоками та масштабувати її для використання у складних реальних умовах, включаючи вуличні сцени з оклюзіями та великою кількістю об’єктів. Отримані в роботі рішення можуть слугувати основою для подальшого розвитку інтелектуальних відеоаналітичних систем, зокрема шляхом розширення на мультимодальні дані, вбудовані платформи та задачі виявлення аномальної поведінки. Апробація результатів роботи Положення даної роботи та проміжні результати доповідались і обговорювались на наступних конференціях: 1. Прикладна математика та комп'ютинг 2025, м. Київ, 2025. 2. Proceedings of the 4th International scientific and practical conference. BoScience Publisher. Chicago, USA. Публікації 1. Сергієнко П. А., Філіпенко Д. О. Спосіб розпізнавання поведінкових патернів на основі попередньо відомих образів// International experience in scientific research. Proceedings of the 4th International scientific and practical conference. BoScience Publisher. Чикаго, USA. 2025. – С. 243 – 245. URL:https://sci-conf.com.ua/iv-mizhnarodna-naukovo-praktichna-konferentsiya-international-experience-in-scientific-research-20-22-11-2025-chikago-ssha-arhiv/. 2. Сергієнко П. А., Філіпенко Д. О. Спосіб розпізнавання поведінкових патернів на основі попередньо відомих образів // Прикладна математика та комп'ютинг 2025. – Київ. ПМК-2025. – С. 285 – 289 Структура та обсяг роботи. Магістерська дисертація складається з вступу, трьох розділів, висновків до кожного розділу та загальних висновків по роботі в цілому, списку використаних літературних джерел. У вступі подано загальну характеристику роботи, описано сучасний стан проблеми, обґрунтовано актуальність теми дослідження, сформульовано мету та задачі роботи, а також наведено відомості про наукову новизну та практичну цінність отриманих результатів. У першому розділі розглянуто огляд сучасних методів детекції, трекінгу та класифікації дій у відеопотоці, проаналізовано набори даних UCF101, NTU RGB+D та MOT17. У другому розділі представлено базову систему на основі YOLOv8n, DeepSORT та LSTM з оцінкою ефективності на контрольованих наборах. У третьому розділі розроблено та реалізовано вдосконалення: механізм уваги в ReUD, графові нейронні мережі для трекінгу, інтеграцію зовнішньої пам’яті, адаптацію доменів, комбінування ознак за допомогою MediaPipe. У висновках підсумовано результати проведеної роботи. У роботі представлено 11 таблиць, 24 рисунків, список використаних літературних джерел (39 найменувань), 14 слайдів презентації.

Опис

Ключові слова

розпізнавання дій, детекція об’єктів, трекінг, глибоке навчання, механізм уваги, графові нейронні мережі, адаптація доменів, оцінка пози, веб-додаток., action recognition, object detection, tracking, deep learning, attention mechanism, graph neural networks, domain adaptation, pose estimation, web application.

Бібліографічний опис

Філіпенко, Д. О. Спосіб розпізнавання поведінкових патернів на основі попередньо відомих образів : магістерська дис. : 123 Комп'ютерна інженерія / Філіпенко Данило Олександрович. – Київ, 2025. – 122 с.

ORCID

DOI