Система виявлення активності голосу та розпізнавання мови на основі глибоких нейронних мереж
Вантажиться...
Дата
2024
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Магістерська дисертація: 95 с., 3 рис., 22 табл., 1 додаток, 30 джерел.
Тема: розробка системи виявлення голосової активності та
розпізнавання мови на основі глибоких нейронних мереж.
Об’єкт дослідження: системи виявлення голосової активності та
розпізнавання мови, що забезпечують перетворення аудіопотоку в текст у
режимі реального часу за допомогою нейронних мереж.
Предмет дослідження: розробка та реалізація системи розпізнавання
мови, яка включає модуль виявлення голосової активності (VAD) та систему
розпізнавання тексту з аудіопотоку.
Мета роботи: дослідити та розробити систему розпізнавання мови, що
працює в реальному часі, із використанням глибоких нейронних мереж для
ідентифікації голосової активності та перетворення голосового сигналу в
текст.
Методи дослідження: обробка аудіосигналів, глибокі нейронні мережі,
машинне навчання.
Актуальність: зростаючий попит на інтерактивні та автономні голосові
системи підвищує важливість розробки високоефективних рішень.
Використання глибоких нейронних мереж дозволяє досягти високої точності
у виявленні голосової активності та розпізнаванні мови.
Результати роботи: розроблено модель ResNet50 для виявлення
голосової активності (VAD), навчено її з використанням датасету RealVAD.
Реалізовано систему розпізнавання мови на основі моделі whisper для
конвертації активних аудіофрагментів у текст у режимі реального часу.
Опис
Ключові слова
виявлення голосової активності, розпізнавання мови, нейронні мережі, машинне навчання, voice activity detection, language recognition, neural networks, machine learning
Бібліографічний опис
Заяць, В. А. Система виявлення активності голосу та розпізнавання мови на основі глибоких нейронних мереж : магістерська дис. : 124 Системний аналіз / Заяць Владислав Андрійович. - Київ, 2024. - 96 с.