Повышение робастности систем автоматического распознавания речи методами обработки сигналов
dc.contributor.advisor | Продеус, Аркадий Николаевич | |
dc.contributor.author | Ладошко, Ольга Николаевна | |
dc.contributor.degreedepartment | акустики и акустоэлектроники | uk |
dc.contributor.degreefaculty | электроники | uk |
dc.contributor.degreegrantor | Национальный технический университет Украины "Киевский политехнический институт" | uk |
dc.date.accessioned | 2016-04-12T09:36:33Z | |
dc.date.available | 2016-04-12T09:36:33Z | |
dc.date.issued | 2016 | |
dc.description.abstractuk | Дисертацію присвячено вирішенню актуальної задачі підвищення робастності систем автоматичного розпізнавання мовлення шляхом розробки нових методів обробки мовленнєвих сигналів. Удосконалено метод ослаблення пізньої реверберації, що дозволяє підвищити точність систем автоматичного розпізнавання мовлення навіть в умовах недостатності апріорної інформації про параметри реверберації. Проведена експериментальна перевірка доцільності використання подання мовленнєвих сигналів в просторі ознак PNCC разом з використанням детектора голосової активності, що дозволяє забезпечити робастність системи автоматичного розпізнавання мовлення при використанні PNCC ознак в умовах нестаціонарного шуму. За отриманими результатами зроблено висновок про необхідність вдосконалення методу PNCC шляхом заміни процедури роздільної обробки голосової активності на основі енергетичного підходу на більш стійкі щодо дії нестаціонарних шумів методи. Розроблено нейромережевий детектор голосової активності системи автоматичного розпізнавання мовлення, що дало можливість використовувати такі ознаки як нормалізовані за потужністю кепстральні коефіцієнти при роботі з нестаціонарними шумами. Розширено перелік ознак запропонованого нейромережевого детектору голосової активності за рахунок введення ознаки «траєкторія основного тону», що дозволило підвищити завадостійкість його роботи. Удосконалено метод навчання нейромережевого детектора голосової активності. Для цього запропоновано алгоритм адаптивної корекції параметрів стаціонарної нелінійної MLP мережі, що дозволило прискорити процедуру навчання такого детектора. Працездатність та ефективність запропонованого детектору голосової активності була експериментально підтверджена шляхом тестування на стандартних сигналах, спотворених білим та рожевим шумами та на реальних сигналах, отриманих з телефонного каналу зв’язку NTIMIT. Результати порівняння запропонованого детектору MLP-IDBD з алгоритмами Д. Їнґ, Д. Согн та алгоритмами міжнародних стандартів ETSI AMR та ITU G.729 показали, що запропонований в даній дисертації детектор MLP-IDBD має перевагу над конкурентними аналогами за критерієм проценту правильно розпізнаних фреймів. | |
dc.format.page | 185 с. | uk |
dc.identifier.citation | Ладошко О. Н. Повышение робастности систем автоматического распознавания речи методами обработки сигналов : дисс. ... канд. техн. наук. : 05.09.08 – прикладная акустика и звукотехника / Ольга Николаевна Ладошко. - Киев, 2016. - 185 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/15361 | |
dc.language.iso | ru | uk |
dc.publisher.place | Киев | uk |
dc.status.pub | published | uk |
dc.subject | детектор голосової активності | uk |
dc.subject | корекція мовних сигналів | uk |
dc.subject | пізня реверберація | uk |
dc.subject | робастність систем автоматичного розпізнавання мовлення | uk |
dc.subject | частота основного тону | uk |
dc.subject | штучні нейронні мережі | uk |
dc.subject | детектор голосовой активности | ru |
dc.subject | искусственные нейронные сети | ru |
dc.subject | коррекция речевых сигналов | ru |
dc.subject | поздняя реверберация | ru |
dc.subject | робастность систем автоматического распознавания речи | ru |
dc.subject | частота основного тона | ru |
dc.subject | late reverberation suppression | en |
dc.subject | neural network | en |
dc.subject | pitch tracking | en |
dc.subject | robust speech recognition | en |
dc.subject | speech enhancement | en |
dc.subject | voice activity detection | en |
dc.subject.udc | 534.78:004.934(043.3) | uk |
dc.title | Повышение робастности систем автоматического распознавания речи методами обработки сигналов | uk |
dc.type | Thesis Doctoral | uk |
thesis.degree.level | candidate | uk |
thesis.degree.name | кандидат технических наук | uk |
thesis.degree.speciality | 05.09.08 – прикладная акустика и звукотехника | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Ladoshko_diss.pdf
- Розмір:
- 3.23 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 1.7 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: