Автоматизована веб-система визначення аудіо атрибутів з використанням нейронних мереж

Вантажиться...
Ескіз

Дата

2024

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Дипломна робота виконана на 91 сторінці, містить 10 ілюстрацій, 6 таблиць, один додаток, 21 джерело в переліку посилань. Мета роботи – розробка автоматизованої веб системи для виявлення аудіоатрибутів з використанням нейронних мереж, а саме класифікація жанру музики та присутності голосу, з застосуванням веб інтерфейсу. Методи та засоби – порівняльний аналіз, проєктування, прототипування, нейронна мережа Wave2Vec2, веб фреймворк Streamlit, база даних SQLite, датасет GTZAN, середовще розробки VSCode. Результат – веб система для класифікації жанрів та присутності голосу, з веб інтерфейсом, та графіками з результатами класифікації.

Опис

Основними структурними елементами розробленої системи для виявлення аудіоатрибутів є клієнтська веб-частина та серверна частина з нейронною мережею для класифікації. Поєднання цих компонентів забезпечує інтерактивний інтерфейс для завантаження аудіофайлів і отримання результатів класифікації у вигляді передбачених музичних жанрів та наявності голосу. Клієнтська частина, реалізована за допомогою фреймворку Streamlit, надає зручний інтерфейс для користувачів. Через неї користувачі можуть завантажити аудіофайл, переглянути його хвильову форму, вибрати параметри обробки та надіслати запит до серверної частини для класифікації. Вона також забезпечує відображення результатів класифікації у вигляді передбаченого жанру музики та вказівки наявності або відсутності голосу. Серверна частина містить нейронну мережу, засновану на моделі Wave2Vec2, яка обробляє завантажені аудіофайли. Після отримання запиту від клієнтської частини сервер аналізує аудіофайл, розбиває його на сегменти та проводить класифікацію відповідно до визначених параметрів. Модель генерує два результати — музичний жанр та наявність голосу, які передаються назад у клієнтський інтерфейс для відображення користувачу. Розроблена система забезпечує зручність та ефективність у задачах класифікації аудіофайлів і має практичне застосування у різних сферах, пов’язаних із автоматизацією аналізу звукових даних.

Ключові слова

аудіоаналіз, Wave2Vec2, нейронні мережі, класифікація аудіо, веб-система, машинне навчання, автоматизація, глибинне навчання, обробка сигналів, GTZAN dataset

Бібліографічний опис

Уваровський, О. Д. Автоматизована веб-система визначення аудіо атрибутів з використанням нейронних мереж : магістерська дис. : 122 Комп’ютерні науки / Уваровський Олександр Дмитрович. – Київ, 2024. – 91 с.

DOI