Локалізація джерела звуку з використанням конволюційних нейронних мереж
dc.contributor.advisor | Бритов, Олексій Анатолійович | |
dc.contributor.author | Косюк, Олексій Михайлович | |
dc.date.accessioned | 2023-10-24T07:56:47Z | |
dc.date.available | 2023-10-24T07:56:47Z | |
dc.date.issued | 2023 | |
dc.description.abstract | Метою дипломної роботи є розробка моделей машинного навчання з вчителем на базі конволюційних нейронних мереж (CNN) для вирішення двовимірної задачі локалізації джерела звуку в умовах завад та реверберації шляхом знаходження кута між джерелом звуку і геометричним центром масиву мікрофонів, які реєструють звуковий сигнал, згенерований джерелом. Результати дипломної роботи: 1) Розроблено програму для синтезу звукових сигналів, зареєстрованих сенсорами за різних положень джерела звуку та різних рівнів завад та реверберації, з декількох звукових сигналів, що генеруються джерелом. 2) Досліджено точність алгоритмів SRP PHAT та MUSIC. 3) Спроектовано та реалізовано алгоритми попередньої обробки звукових сигналів перед передачею останніх на вхід CNN моделей. 4) Розроблено та навчено 2 CNN моделі для отримання точності, вищої за точність алгоритмів SRP PHAT та MUSIC. 5) Протестовано створені моделі та порівняно їх точність із точністю алгоритмів SRP PHAT та MUSIC. Показано можливість невеликої СNN моделі (669371 параметр) з двома згортковими шарами всього за 100 епох навчанння давати на навчальному датасеті точність, співставну з точностями алгоритмів SRP PHAT та MUSIC. Досліджено використання натренованої для класифікації зображень CNN MobileNetV2 для фільтрації завад та реверберації у звуковому сигналі. Загальний обсяг роботи 135 с., 35 рис., 38 таблиць, 5 додатків, 24 джерела. | uk |
dc.description.abstractother | The aim of the thesis is to develop СNN based supervised machine learning models for solving the two-dimensional sound source localization problem in conditions of noises and reverberation by finding the angle between the sound source and the geometric center of the array of microphones that register the sound signal generated by the source. 1) A program was developed for the synthesis of sound signals registered by sensors at different positions of the sound source and at different levels of noise and reverberation from sound signals generated by the source. 2) The accuracy of the SRP PHAT and MUSIC algorithms was investigated. 3) Algorithms for preprocessing audio signals before transmitting them to CNN models were designed and implemented. 4) 2 CNN models were developed and trained to obtain accuracy higher than that of SRP PHAT and MUSIC algorithms. 5) The created models were tested and their accuracy was compared with the accuracy of the SRP PHAT and MUSIC algorithms. The possibility of a small CNN model (669371 parameters) with two convolutional layers in just 100 training epochs to provide an accuracy comparable to the accuracy of the SRP PHAT and MUSIC algorithms on the training dataset was shown. The use of CNN MobileNetV2, trained for image classification, to filter interference and reverberation in an audio signal is investigated. Total volume of thesis is 135 pages, 35 figures, 38 tables, 5 app., 24 sources. | uk |
dc.format.extent | 135 с. | uk |
dc.identifier.citation | Косюк, О. М. Локалізація джерела звуку з використанням конволюційних нейронних мереж : дипломний проект … бакалавра : 122 Комп'ютерні науки / Косюк Олексій Михайлович . – Київ, 2023. – 135 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/61710 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | локалізація джерела звуку | uk |
dc.subject | реверберація | uk |
dc.subject | завади | uk |
dc.subject | конволюційні нейронні мережі | uk |
dc.subject | машинне навчання з вчителем | uk |
dc.subject | SRP PHAT | uk |
dc.subject | MUSIC | uk |
dc.subject | MobileNetV2 | uk |
dc.subject | sound localization | uk |
dc.subject | reverberation | uk |
dc.subject | noise | uk |
dc.subject | convolutional neural networks | uk |
dc.subject | supervised machine learning | uk |
dc.title | Локалізація джерела звуку з використанням конволюційних нейронних мереж | uk |
dc.title.alternative | Sound source localization using convolutional neural networks | uk |
dc.type | Bachelor Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Kosiuk_bakalavr.pdf
- Розмір:
- 3.36 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 1.71 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: