Алгоритм оброблення аудiосигналiв iз використанням методу машинного навчанн

Сокольський, С. О.; Мовчанюк, А. В.

Алгоритм оброблення аудiосигналiв iз використанням методу машинного навчанн

dc.contributor.author	Сокольський, С. О.
dc.contributor.author	Мовчанюк, А. В.
dc.date.accessioned	2023-12-05T10:14:31Z
dc.date.available	2023-12-05T10:14:31Z
dc.date.issued	2023
dc.description.abstract	Малi безпiлотнi лiтальнi апарати або дрони швидко розвиваються та впроваджуються. Але це також збiльшує i загрозу громадськiй та нацiональнiй безпецi через ризики їхнього неправомiрного використання. Перспективним напрямком для вирiшення цiєї проблеми є акустичний метод, що включає в себе аналiз звукових характеристик i доплерiвського зсуву сигнатур безпiлотникiв, використання масивiв мiкрофонiв та методи машинного навчання. Задачею цiєї статтi є розроблення алгоритму для ефективного виявлення та класифiкацiї аудiосигналiв малих безпiлотних лiтальних апаратiв iз використанням згорткової нейронної мережi глибокого навчання, побудова архiтектури та оцiнка ефективностi її роботи. Перед подачею набору аудiозаписiв дронiв на вхiд мережi, пiдвищили їхню якiсть застосувавши нормалiзацiю, Вiнеровську фiльтрацiю, сегментацiю — подiлили аудiо на кадри тривалiстю 25 мс з перекриттям 50% та вiконне керування за допомогою вiкна Хеммiнга, оскiльки у завданнi оброблення аудiосигналiв важливiша точнiсть у часовiй областi. Отриманi данi роздiлили у спiввiдношеннi 60/20/20 на три набори: для навчання, валiдацiї та тестування. Далi представили данi спрощеним набором ознак, визначивши з кожного кадру оброблених аудiосигналiв мел-спектрограми, для фiксацiї часових та спектральних характеристик. Дiапазон частот аналiзу становить межi робочих частот моделi мiкрофону (20 Гц — 20 кГц), частотна роздiлова здатнiсть 50 Гц, а кiлькiсть робочих мел-смуг дорiвнює 30. Використовуючи навчальнi данi та отриманi ознаки аудiосигналiв, розробили архiтектуру нейронної мережi для дослiджень роботи алгоритму виявлення дронiв. Вона складається iз 10 пар шарiв згортки, ReLU, пакетної нормалiзацiї та максимального пулингу. Їхня кiлькiсть визначається розмiром вiкна об’єднання в часi. Наступними є шари згладжування, вiдсiкання, повнозв’язний та Softmax. Для нормалiзацiї вихiдних даних i отримання фiнальних ймовiрностей застосовується шар класифiкацiї. У якостi оптимiзатора для навчання моделi обрано Adam, початкова швидкiсть навчання дорiвнює 0.001, а пiсля проходження 75% епох поступово зменшується у 10 разiв, для покращення збiжностi. Точнiсть розпiзнавання даних складає 99%, оцiнка F1 — 0.93, що вказує на високий рiвень загальної продуктивностi архiтектури. Максимальна вiдстань ефективного виявлення дронiв алгоритмом складає 200 м.	uk
dc.description.abstractother	Small unmanned aerial vehicles (UAVs) rapidly develop and are implemented in various industries to make people’s lives easier. However, there are potential risks in their use, such as unauthorized surveillance of critical infrastructure objects and the delivery of explosive devices, which poses a significant threat to public and national security. The acoustic method promises direction for solving this issue by analyzing the sound characteristics and Doppler shift signatures of UAVs, using microphone arrays and machine learning techniques. The aim of this article is to develop an algorithm for effective detection and classification of drone audio signals using a deep learning convolutional neural network (CNN), constructing its architecture, and evaluating its performance. Before submitting the drone audio dataset into the neural network, the quality of the audio recordings is improved through normalization, Wiener filtering, and segmentation. The audio is segmented into frames with a duration of 25 ms and a 50% overlap, applying Hamming windowing for better accuracy in the time domain, as temporal precision is crucial in audio signal processing. The obtained data is divided into three sets in a 60/20/20 ratio: for training, validation, and testing purposes. Next, the data is represented by a simplified set of features, extracting mel-spectrograms from each frame of the processed audio signals to capture their temporal and spectral characteristics. The frequency range of analysis corresponds to the working frequency limits of the microphone model (20 Hz - 20 kHz), with a frequency resolution of 50 Hz and 30 working mel frequency bands. Using the training data and the extracted audio features, a neural network architecture is developed to investigate the performance of the drone detection and classification algorithm. It consists of 10 pairs of convolutional layers, ReLU activation, batch normalization, and max-pooling layers. The number of these layers is determined by the size of the pooling window along the time dimension. This follows by flattening, dropout, fully connected, and Softmax layers. A classification layer is applied to normalize the output data and obtain final probabilities. The Adam optimizer is chosen for model training. Based on the dataset set, the initial learning rate is set to 0.001, gradually decreasing by a factor of 10 after 75% of the epochs to enhance convergence. The accuracy of the input data recognition reaches 99%, and the F1 score of the trained model is 0.93, indicating a high level of overall architecture performance. The maximum distance of effective detection of drones by the algorithm is 200 m.	uk
dc.format.pagerange	Pp. 39-51	uk
dc.identifier.citation	Сокольський, С. О. Алгоритм оброблення аудiосигналiв iз використанням методу машинного навчання / Сокольський С. О., Мовчанюк А. В. // Вісник НТУУ «КПІ». Радіотехніка, радіоапаратобудування : збірник наукових праць. – 2023. – Вип. 93. – С. 39-51. – Бібліогр.: 15 назв.	uk
dc.identifier.doi	https://doi.org/10.20535/RADAP.2023.93.39-51
dc.identifier.orcid	0000-0002-2409-1539	uk
dc.identifier.orcid	0000-0003-2901-0424	uk
dc.identifier.uri	https://ela.kpi.ua/handle/123456789/62780
dc.language.iso	uk	uk
dc.publisher	КПІ ім. Ігоря Сікорського	uk
dc.publisher.place	Київ	uk
dc.relation.ispartof	Вісник НТУУ «КПІ». Радіотехніка, радіоапаратобудування : збірник наукових праць, Вип. 93	uk
dc.rights.uri	https://creativecommons.org/licenses/by/4.0/
dc.subject	дрон	uk
dc.subject	малий безпiлотний лiтальний апарат	uk
dc.subject	спектр	uk
dc.subject	обробка сигналу	uk
dc.subject	виявлення сигналу	uk
dc.subject	згортковi нейроннi мережi	uk
dc.subject	глибоке навчання	uk
dc.subject	drone	uk
dc.subject	small unmanned aerial vehicle	uk
dc.subject	spectrum	uk
dc.subject	signal processing	uk
dc.subject	signal detection	uk
dc.subject	convolutional neural networks	uk
dc.subject	deep learning	uk
dc.subject.udc	004.93	uk
dc.title	Алгоритм оброблення аудiосигналiв iз використанням методу машинного навчанн	uk
dc.title.alternative	Algorithm for Processing Audio Signals Using Machine Learning	uk
dc.type	Article	uk

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: 1955-5769-1-10-20230930.pdf
Розмір:: 905.09 KB
Формат:: Adobe Portable Document Format
Опис:

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 9.1 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Вісник НТУУ «КПІ». Радіотехніка, радіоапаратобудування : збірник наукових праць, Вип. 93