Система виявлення активності голосу та розпізнавання мови на основі глибоких нейронних мереж

Вантажиться...
Ескіз

Дата

2024

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Магістерська дисертація: 95 с., 3 рис., 22 табл., 1 додаток, 30 джерел. Тема: розробка системи виявлення голосової активності та розпізнавання мови на основі глибоких нейронних мереж. Об’єкт дослідження: системи виявлення голосової активності та розпізнавання мови, що забезпечують перетворення аудіопотоку в текст у режимі реального часу за допомогою нейронних мереж. Предмет дослідження: розробка та реалізація системи розпізнавання мови, яка включає модуль виявлення голосової активності (VAD) та систему розпізнавання тексту з аудіопотоку. Мета роботи: дослідити та розробити систему розпізнавання мови, що працює в реальному часі, із використанням глибоких нейронних мереж для ідентифікації голосової активності та перетворення голосового сигналу в текст. Методи дослідження: обробка аудіосигналів, глибокі нейронні мережі, машинне навчання. Актуальність: зростаючий попит на інтерактивні та автономні голосові системи підвищує важливість розробки високоефективних рішень. Використання глибоких нейронних мереж дозволяє досягти високої точності у виявленні голосової активності та розпізнаванні мови. Результати роботи: розроблено модель ResNet50 для виявлення голосової активності (VAD), навчено її з використанням датасету RealVAD. Реалізовано систему розпізнавання мови на основі моделі whisper для конвертації активних аудіофрагментів у текст у режимі реального часу.

Опис

Ключові слова

виявлення голосової активності, розпізнавання мови, нейронні мережі, машинне навчання, voice activity detection, language recognition, neural networks, machine learning

Бібліографічний опис

Заяць, В. А. Система виявлення активності голосу та розпізнавання мови на основі глибоких нейронних мереж : магістерська дис. : 124 Системний аналіз / Заяць Владислав Андрійович. - Київ, 2024. - 96 с.

DOI