Сокольський, С. О.Мовчанюк, А. В.2023-12-052023-12-052023Сокольський, С. О. Алгоритм оброблення аудiосигналiв iз використанням методу машинного навчання / Сокольський С. О., Мовчанюк А. В. // Вісник НТУУ «КПІ». Радіотехніка, радіоапаратобудування : збірник наукових праць. – 2023. – Вип. 93. – С. 39-51. – Бібліогр.: 15 назв.https://ela.kpi.ua/handle/123456789/62780Малi безпiлотнi лiтальнi апарати або дрони швидко розвиваються та впроваджуються. Але це також збiльшує i загрозу громадськiй та нацiональнiй безпецi через ризики їхнього неправомiрного використання. Перспективним напрямком для вирiшення цiєї проблеми є акустичний метод, що включає в себе аналiз звукових характеристик i доплерiвського зсуву сигнатур безпiлотникiв, використання масивiв мiкрофонiв та методи машинного навчання. Задачею цiєї статтi є розроблення алгоритму для ефективного виявлення та класифiкацiї аудiосигналiв малих безпiлотних лiтальних апаратiв iз використанням згорткової нейронної мережi глибокого навчання, побудова архiтектури та оцiнка ефективностi її роботи. Перед подачею набору аудiозаписiв дронiв на вхiд мережi, пiдвищили їхню якiсть застосувавши нормалiзацiю, Вiнеровську фiльтрацiю, сегментацiю — подiлили аудiо на кадри тривалiстю 25 мс з перекриттям 50% та вiконне керування за допомогою вiкна Хеммiнга, оскiльки у завданнi оброблення аудiосигналiв важливiша точнiсть у часовiй областi. Отриманi данi роздiлили у спiввiдношеннi 60/20/20 на три набори: для навчання, валiдацiї та тестування. Далi представили данi спрощеним набором ознак, визначивши з кожного кадру оброблених аудiосигналiв мел-спектрограми, для фiксацiї часових та спектральних характеристик. Дiапазон частот аналiзу становить межi робочих частот моделi мiкрофону (20 Гц — 20 кГц), частотна роздiлова здатнiсть 50 Гц, а кiлькiсть робочих мел-смуг дорiвнює 30. Використовуючи навчальнi данi та отриманi ознаки аудiосигналiв, розробили архiтектуру нейронної мережi для дослiджень роботи алгоритму виявлення дронiв. Вона складається iз 10 пар шарiв згортки, ReLU, пакетної нормалiзацiї та максимального пулингу. Їхня кiлькiсть визначається розмiром вiкна об’єднання в часi. Наступними є шари згладжування, вiдсiкання, повнозв’язний та Softmax. Для нормалiзацiї вихiдних даних i отримання фiнальних ймовiрностей застосовується шар класифiкацiї. У якостi оптимiзатора для навчання моделi обрано Adam, початкова швидкiсть навчання дорiвнює 0.001, а пiсля проходження 75% епох поступово зменшується у 10 разiв, для покращення збiжностi. Точнiсть розпiзнавання даних складає 99%, оцiнка F1 — 0.93, що вказує на високий рiвень загальної продуктивностi архiтектури. Максимальна вiдстань ефективного виявлення дронiв алгоритмом складає 200 м.ukдронмалий безпiлотний лiтальний апаратспектробробка сигналувиявлення сигналузгортковi нейроннi мережiглибоке навчанняdronesmall unmanned aerial vehiclespectrumsignal processingsignal detectionconvolutional neural networksdeep learningАлгоритм оброблення аудiосигналiв iз використанням методу машинного навчаннAlgorithm for Processing Audio Signals Using Machine LearningArticlePp. 39-51https://doi.org/10.20535/RADAP.2023.93.39-51004.930000-0002-2409-15390000-0003-2901-0424