Дослідження застосування ознак швидкодіючих нейронних мереж у системах відслідковування на основі дискримінантних кореляційних фільтрів
| dc.contributor.author | Варфоломєєв, А. Ю. | |
| dc.date.accessioned | 2026-04-10T12:13:30Z | |
| dc.date.available | 2026-04-10T12:13:30Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Візуальне відслідковування об'єктів є важливою задачею комп'ютерного зору, що має широке коло застосувань. Не зважаючи на те, що на сьогодні запропоновано чимало різноманітних рішень для вирішення даної задачі, далеко не всі з них спроможні працювати в реальному часі, особливо на мобільних та вбудованих обчислювальних платформах. Одними з методів, які здатні забезпечити високу швидкодію та надійність відслідковування залишаються підходи, основані на дискримінантних кореляційних фільтрах (DCF). Найостанніші реалізації цих підходів використовують ознаки, отримувані з великих і обчислювально-складних нейронних мереж, таких, зокрема, як VGG та ResNet, що з одного боку дозволяє підвищити якість відслідковування, але з іншого — робить такі рішення ресурсоємними та подекуди недопустимо повільними. При цьому застосування ознак із легких і швидкодіючих нейронних мереж у системах відслідковування на базі DCF практично не досліджені. Ця робота якраз і присвячена даному питанню. Із застосуванням базової системи відслідковування на основі дискримінантного кореляційного фільтра (DCF), що в якості оптимізаційної процедури використовує метод множників зі зміною напрямків (ADMM) проведено аналіз ознак, отримуваних із ряду швидкодіючих нейронних мереж, серед яких: SqueezeNet, MobileNetV3, ShuffleNet-9, а також малих моделей детекторів YOLO. При цьому обґрунтовано вибір шарів із яких доцільно отримувати ознаки та за методикою тесту VOT Challenge 2019 оцінено точність і надійність відслідковування, а також на мобільному ПК та двох популярних вбудованих обчислювальних платформах (Nvidia Jetson Nano та Raspberry Pi 5) визначено середню швидкодію обробки кадрів при використанні ознак кожної з зазначених мереж. В результаті проведеного дослідження встановлено, що найбільш доцільними у використанні з огляду на компроміс між швидкодією та якістю відслідковування є ознаки отримувані із мереж YOLOv3 tiny та SqueezeNet. | |
| dc.description.abstractother | Introduction. Visual object tracking is an important computer vision problem that has a wide range of applications. Although there are many tracking methods exist, not all of them can solve the problem in real-time, especially on mobile and embedded platforms. One of the approaches that permit achieving a trade-off between a high processing speed and tracking reliability is based on the discriminative correlation filters (DCF). The latest implementations of this approach use features, extracted from large and computationally intensive neural networks, such as VGG or ResNet. On the one hand, it enabled to improve tracking quality, but on the other, made trackers too computationally demanding and unacceptably slow for some applications. At the same time, features from lightweight and fast neural networks within the DCF-based tracking approach are practically little studied. This paper is partially intended to fill this gap. Theoretic results. Using the tracker, which is based on the discriminative correlation filter (DCF) that utilizes the alternating direction methods of multipliers (ADMM) as the optimizer, we analyzed the features, extracted from the lightweight convolutional neural networks such as SqueezeNet, MobileNetV3, ShuffleNet-9, and the tiny/nano YOLO detectors. Particularly, we justified the selection of specific layers from which it is the most expedient to extract the features, and using the VOT Challenge 2019 as the benchmark, estimated the tracking robustness and precision. Using the mobile PC and two popular embedded platforms (Nvidia Jetson Nano and Raspberry Pi 5) we also measured the average frame processing time for all the tested features of the mentioned neural networks. Conclusions. Our study found that the most efficient features, which provide the trade-off between processing speed and tracking quality, are the ones extracted from the YOLOv3 tiny and SqueezeNet neural networks. | |
| dc.format.pagerange | С. 39-50 | |
| dc.identifier.citation | Варфоломєєв, А. Ю. Дослідження застосування ознак швидкодіючих нейронних мереж у системах відслідковування на основі дискримінантних кореляційних фільтрів / А. Ю. Варфоломєєв // Вісник НТУУ «КПІ». Радіотехніка, радіоапаратобудування : збірник наукових праць. – 2025. – Вип. 101. – С. 39-50. – Бібліогр.: 32 назв. | |
| dc.identifier.doi | https://doi.org/10.64915/RADAP.2025.101.39-50 | |
| dc.identifier.orcid | 0000-0002-6990-7140 | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/80098 | |
| dc.language.iso | uk | |
| dc.publisher | КПІ ім. Ігоря Сікорського | |
| dc.publisher.place | Київ | |
| dc.relation.ispartof | Вісник НТУУ «КПІ». Радіотехніка, радіоапаратобудування : збірник наукових праць, Вип. 101, 2025 | |
| dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | візуальне відслідковування об’єктів | |
| dc.subject | нейромережні ознаки | |
| dc.subject | дискримінантні кореляційні фільтри (DCF) | |
| dc.subject | метод множників зі зміною напрямків (ADMM) | |
| dc.subject | visual object tracking | |
| dc.subject | neural network features | |
| dc.subject | discriminative correlation filters (DCF) | |
| dc.subject | alternating direction method of multipliers (ADMM) | |
| dc.subject.udc | 004.932.2 | |
| dc.title | Дослідження застосування ознак швидкодіючих нейронних мереж у системах відслідковування на основі дискримінантних кореляційних фільтрів | |
| dc.title.alternative | Study of the Use of Features Extracted From the Lightweight and Fast Neural Networks in the Visual Object Trackers Based on Discriminative Correlation Filters | |
| dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: