Застосування методів штучного інтелекту в задачі автоматичного розпізнавання мовлення
Вантажиться...
Дата
2018
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
Анотація
Магістерська дисертація: 133 с., 17 Рисунків, 23 табл., 39 джерел літератури, 1 додаток.
Об’єкт дослідження: алгоритми автоматичного розпізнавання мовлення.
Предмет дослідження: обробка природних мов.
Цілі дослідження: створення системи з перетворення аудіофайлів у
текстові записи в контексті нарад.
Задачі роботи: розробити штучну нейронну мережу для автоматичного
розпізнавання мовлення, тобто розробити інформаційну систему з веб- інтерфейсом, що могла б за командою користувача провести автоматичне розпізнавання усного мовлення з певного файлу-контейнера, а також надавати можливість індексованого пошуку тексту в уже оброблених записах.
Під час виконання роботи було проведено аналіз сучасних аудіоформатів та методів з розпізнавання інформаційних сигналів, серед методів була обрана комбінація попередньої обробки через MFCC, інтелектуального аналізу через LSTM.
Була розроблена архітектура мережі для розпізнавання мовних символів у звуковому потоці. Актуальність проекту мотивується відсутністю аналогічних рішень і потенційною зацікавленістю з боку бізнесу.
Результати роботи можуть бути використані як комерційними організаціями, так і ентузіастами, що прагнуть розробити щось подібне.
Опис
Ключові слова
аналіз MP3, автоматичне розпізнавання мовлення, Python, tensorflow, Keras, MFCC, LSTM, RNN, CTC, MP3 analysis, automatic speech recognition
Бібліографічний опис
Бех, П. В. Застосування методів штучного інтелекту в задачі автоматичного розпізнавання мовлення : магістерська дис.: 122 Комп'ютерні науки / Бех Петро Васильович. – Київ, 2018. – 133 с.