Система розпізнавання нечіткого мовлення на основі штучного інтелекту

Вантажиться...
Ескіз

Дата

2025

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Бакалаврський дипломний проєкт включає пояснювальну записку(50 сторінок, 12 рисунків, 4 додатки, 1 таблиця). Метою даної дипломної роботи є розробка системи розпізнавання мови, здатної перетворювати аудіовхід на текстову послідовність. В процесі роботи було виконано комплекс завдань. Спочатку було проведено збір та попередню обробку даних, включно з очищенням та нормалізацією аудіофайлів та відповідних транскрипцій. Важливим етапом стала розробка архітектури глибокої нейронної мережі, яка дозволяє моделі ефективно захоплювати залежності між вхідними аудіо ознаками (MFCC) та вихідними текстовими послідовностями. Було реалізовано режим тренування моделі для навчання на великих обсягах даних. Приділено значну увагу оптимізації параметрів моделі та вибору відповідних функцій витрат для забезпечення високої якості навчання. В результаті роботи було отримано функціональну систему розпізнавання мови, яка продемонструвала здатність точно транскрибувати усне мовлення з тестових наборів даних. Розроблена модель успішно перетворює аудіофайли у відповідні текстові послідовності, підтверджуючи ефективність обраної архітектури та підходів до навчання. Область подальшого використання отриманих результатів охоплює розробку інтелектуальних голосових помічників та розширення можливостей систем доступності для людей з обмеженими можливостями.

Опис

Ключові слова

розпізнавання мови, MFCC, нейронна мережа, аудіо, транскрипція, модель seq2seq, speech recognition, neural network, audio, transcription, seq2seq model

Бібліографічний опис

Сурмачевський, В. В. Система розпізнавання нечіткого мовлення на основі штучного інтелекту : дипломний проєкт ... бакалавра : 123 Комп'ютерна інженерія / Сурмачевський Владислав Володимирович. – Київ, 2025. – 73 с.

ORCID

DOI