Повышение робастности систем автоматического распознавания речи методами обработки сигналов

dc.contributor.advisorПродеус, Аркадий Николаевич
dc.contributor.authorЛадошко, Ольга Николаевна
dc.contributor.degreedepartmentакустики и акустоэлектроникиuk
dc.contributor.degreefacultyэлектроникиuk
dc.contributor.degreegrantorНациональный технический университет Украины "Киевский политехнический институт"uk
dc.date.accessioned2016-04-12T09:36:33Z
dc.date.available2016-04-12T09:36:33Z
dc.date.issued2016
dc.description.abstractukДисертацію присвячено вирішенню актуальної задачі підвищення робастності систем автоматичного розпізнавання мовлення шляхом розробки нових методів обробки мовленнєвих сигналів. Удосконалено метод ослаблення пізньої реверберації, що дозволяє підвищити точність систем автоматичного розпізнавання мовлення навіть в умовах недостатності апріорної інформації про параметри реверберації. Проведена експериментальна перевірка доцільності використання подання мовленнєвих сигналів в просторі ознак PNCC разом з використанням детектора голосової активності, що дозволяє забезпечити робастність системи автоматичного розпізнавання мовлення при використанні PNCC ознак в умовах нестаціонарного шуму. За отриманими результатами зроблено висновок про необхідність вдосконалення методу PNCC шляхом заміни процедури роздільної обробки голосової активності на основі енергетичного підходу на більш стійкі щодо дії нестаціонарних шумів методи. Розроблено нейромережевий детектор голосової активності системи автоматичного розпізнавання мовлення, що дало можливість використовувати такі ознаки як нормалізовані за потужністю кепстральні коефіцієнти при роботі з нестаціонарними шумами. Розширено перелік ознак запропонованого нейромережевого детектору голосової активності за рахунок введення ознаки «траєкторія основного тону», що дозволило підвищити завадостійкість його роботи. Удосконалено метод навчання нейромережевого детектора голосової активності. Для цього запропоновано алгоритм адаптивної корекції параметрів стаціонарної нелінійної MLP мережі, що дозволило прискорити процедуру навчання такого детектора. Працездатність та ефективність запропонованого детектору голосової активності була експериментально підтверджена шляхом тестування на стандартних сигналах, спотворених білим та рожевим шумами та на реальних сигналах, отриманих з телефонного каналу зв’язку NTIMIT. Результати порівняння запропонованого детектору MLP-IDBD з алгоритмами Д. Їнґ, Д. Согн та алгоритмами міжнародних стандартів ETSI AMR та ITU G.729 показали, що запропонований в даній дисертації детектор MLP-IDBD має перевагу над конкурентними аналогами за критерієм проценту правильно розпізнаних фреймів.
dc.format.page185 с.uk
dc.identifier.citationЛадошко О. Н. Повышение робастности систем автоматического распознавания речи методами обработки сигналов : дисс. ... канд. техн. наук. : 05.09.08 – прикладная акустика и звукотехника / Ольга Николаевна Ладошко. - Киев, 2016. - 185 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/15361
dc.language.isoruuk
dc.publisher.placeКиевuk
dc.status.pubpublisheduk
dc.subjectдетектор голосової активностіuk
dc.subjectкорекція мовних сигналівuk
dc.subjectпізня ревербераціяuk
dc.subjectробастність систем автоматичного розпізнавання мовленняuk
dc.subjectчастота основного тонуuk
dc.subjectштучні нейронні мережіuk
dc.subjectдетектор голосовой активностиru
dc.subjectискусственные нейронные сетиru
dc.subjectкоррекция речевых сигналовru
dc.subjectпоздняя реверберацияru
dc.subjectробастность систем автоматического распознавания речиru
dc.subjectчастота основного тонаru
dc.subjectlate reverberation suppressionen
dc.subjectneural networken
dc.subjectpitch trackingen
dc.subjectrobust speech recognitionen
dc.subjectspeech enhancementen
dc.subjectvoice activity detectionen
dc.subject.udc534.78:004.934(043.3)uk
dc.titleПовышение робастности систем автоматического распознавания речи методами обработки сигналовuk
dc.typeThesis Doctoraluk
thesis.degree.levelcandidateuk
thesis.degree.nameкандидат технических наукuk
thesis.degree.speciality05.09.08 – прикладная акустика и звукотехникаuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Ladoshko_diss.pdf
Розмір:
3.23 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
1.7 KB
Формат:
Item-specific license agreed upon to submission
Опис: