Спосіб розпізнавання нечіткого мовлення з використанням нейромереж
Вантажиться...
Дата
2025
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Актуальність теми. У сучасних системах розпізнавання мовлення особливою проблемою залишається розуміння нечітких або спотворених голосових сигналів, що характерно для реальних умов комунікації. Наявність фонового шуму, реверберації або нечіткої вимови знижує точність традиційних систем розпізнавання автоматичного мовлення. Дифузійна модель здатна відновлювати мовленнєвий сигнал шляхом поступового усунення шуму, що дозволяє підвищити точність розпізнавання нечіткого мовлення. Мета роботи. Розробка системи розпізнавання нечіткого мовлення на основі модифікованого дифузійного алгоритму із використанням варіаційного навчання для підвищення точності розпізнавання мовлення. Об’єкт дослідження. Процес автоматичного розпізнавання нечіткого мовлення у системах штучного інтелекту. Предмет дослідження. Методи та алгоритми розпізнавання нечіткого мовлення. Методи дослідження. У роботі застосовано: математичне моделювання процесу поширення шуму та його реконструкції; аналіз сучасних нейромережевих архітектур (CNN, RNN, Transformer, Diffusion Models), порівняння; варіаційне навчання для персоналізації; експериментальне тестування на багатомовних аудіокорпусах із різними рівнями шуму; статистична оцінка точності та швидкодії системи. Наукова новизна. Запропоновано модифікований дифузійний алгоритм попередньої оброки мовленнєвого сигналу. Обґрунтовано доцільність використання дифузійної моделі для підвищення точності розпізнавання нечіткого мовлення. Практична цінність. Результати дослідження можуть бути використані для створення систем автоматичного розпізнавання мовлення, здатних працювати з нечітким мовленням у реальних умовах.
Апробація результатів. Основні положення та результати роботи були представленні на конференціях:
1. «Прикладна математика та комп’ютинг» ПМК-2025 та опубліковані у збірнику тез доповідей «МОДИФІКОВАНИЙ ДИФУЗІЙНИЙ АЛГОРИТМ ПІДВИЩЕННЯ ТОЧНОСТІ СИСТЕМИ РОЗПІЗНАВАННЯ НЕЧІТКОГО МОВЛЕННЯ»;
2. Науковий журнал «Таврійський науковий вісник. Серія: Технічні науки.» стаття «МОДИФІКОВАНИЙ ДИФУЗІЙНИЙ АЛГОРИТМ ОБРОБКИ НЕЧІТКОГО МОВЛЕННЯ» ;
3. V Міжнародна науково-практична конференція «OPEN SCIENCE NOWADAYS: MAIN MISSION, TRENDS AND INSTRUMENTS, PATH AND ITS DEVELOPMENT» тези «АНАЛІЗ ОБЧИСЛЮВАЛЬНОЇ СКЛАДНОСТІ ДИФУЗІЙНОГО АЛГОРИТМУ ПОПЕРЕДНЬОЇ ОБРОБКИ НЕЧІТКОГО МОВЛЕННЯ ДЛЯ СИСТЕМ РЕАЛЬНОГО ЧАСУ».
Структура та обсяг роботи. Магістерська дисертація складається з вступу, трьох розділів, висновків, список використаних джерел та додатків. Перший розділ присвячено теоретичним засадам розпізнавання спотвореного та нечіткого мовлення. Другий розділ містить опис модифікованого дифузійного алгоритму попередньої обробки аудіосигналу. Подано архітектуру запропонованої системи, описано процеси дифузійної реконструкції. Третій розділ містить практичну реалізацію системи розпізнавання нечіткого мовлення. Розглянуто вибір інструментів, формування датасету, процес навчання й тестування моделі. Подано інтерфейс користувача та результати тестування.
Опис
Ключові слова
нечітке мовлення, система автоматичного розпізнавання мовлення, дифузійна модель, CNN, RNN, Transformer, попередня обробка аудіосигналу., unclear speech, automatic speech recognition system, diffusion model, audio signal preprocessing.
Бібліографічний опис
Шевченко, І. І. Спосіб розпізнавання нечіткого мовлення з використанням нейромереж : магістерська дис. : 123 Комп'ютерна інженерія / Шевченко Іван Іванович. – Київ, 2025. – 82 с