Аналіз впливу параметрів обробки звукового сигналу на якість розпізнавання голосових команд

dc.contributor.authorДюжаєв, Л. П.
dc.contributor.authorКоваль, В. Ю.
dc.contributor.authorDyuzhayev, L. P.
dc.contributor.authorKoval, V. Yu.
dc.contributor.authorДюжаев, Л. П.
dc.contributor.authorКоваль, В. Ю.
dc.date.accessioned2014-07-04T10:09:28Z
dc.date.available2014-07-04T10:09:28Z
dc.date.issued2014
dc.description.abstractenIntroduction. Recognition of single (isolated) voice commands for the task of voice control over different devices is required. Typically, this control method requires high reliability (at least 95% accuracy voice recognition). It should be noted that voice commands are often pronounced in high noisiness. All presently known methods and algorithms of speech recognition do not allow clearly to determine which parameters of sound signal can provide the best results. The main part. On the first level of voice recognition (preprocessing and extracting of acoustic features that have a number of useful features) they are easily calculated, providing a compact representation of the voice commands that are resistant to noise interference. On the next level given command is looked for in the reference dictionary. Input file has to be divided into frames to get MFCC coefficients. Each frame is measured by a window function and processed by discrete Fourier transform. The resulting representation of signal in the frequency domain is divided into ranges using a set of triangular filters. The last step is to perform discrete cosine transform. Method of dynamic time warping allows to get a value, inverse of degree of similarity between given command and a reference. Conclusions. Research has shown that in the field of voice commands recognition optimum results in terms of quality / performance can be achieved using the following parameters of sound signal processing:8 kHz sample rate, frame duration 70-120 ms, Hamming weighting function of a window, number of Fourier samples is 512.uk
dc.description.abstractruВ работе рассмотрено структуру системы распознавания голосовых команд, алгоритм выделения мел-кепстральных коэффициентов и их сравнение методом динамического искажения времени. В системе со словарем из пятидесяти команд произнесенных одним диктором было исследовано влияние на качество распознавания голосовых команд таких параметров как: частота дискретизации, продолжительность фрейма, количество выборок Фурье, вид оконной функции.uk
dc.description.abstractukВ роботі розглянуто структуру системи розпізнавання голосових команд, алгоритм виділення мел-кепстральних коефіцієнтів та їх порівняння методом динамічного викривлення часу. В системі зі словником з п’ятдесяти команд вимовлених одним диктором було досліджено вплив на якість розпізнавання голосової команди таких параметрів як: частоти дискретизації, тривалості фрейму, кількості вибірок Фур’є, виду віконної функції на якість розпізнавання голосової команди.uk
dc.format.pagerangeС. 34-41uk
dc.identifier.citationДюжаєв Л. П. Аналіз впливу параметрів обробки звукового сигналу на якість розпізнавання голосових команд / Дюжаєв Л. П., Коваль В. Ю. // Вісник НТУУ «КПІ». Радіотехніка, радіоапаратобудування : збірник наукових праць. – 2014. – № 56. – С. 34-41. – Бібліогр.: 6 назв.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/8095
dc.language.isoukuk
dc.publisherНТУУ "КПІ"uk
dc.publisher.placeКиївuk
dc.sourceВісник НТУУ «КПІ». Радіотехніка, радіоапаратобудування: збірник наукових працьuk
dc.status.pubpublisheduk
dc.subjectрозпізнавання мовиuk
dc.subjectголосові командиuk
dc.subjectмел-кепстральні коефіцієнтиuk
dc.subjectдинамічне викривлення часуuk
dc.subjectspeech recognitionuk
dc.subjectvoice commandsuk
dc.subjectmel-cepstral coefficientsuk
dc.subjectdynamic time warpinguk
dc.subjectраспознавания речиuk
dc.subjectголосовые командыuk
dc.subjectмел-кепстральные коэффициентыuk
dc.subjectдинамическое искажение времениuk
dc.subject.udc681.58uk
dc.titleАналіз впливу параметрів обробки звукового сигналу на якість розпізнавання голосових командuk
dc.title.alternativeAnalysis of the influence of sound signal processing parameters on the quality voice command recognitionuk
dc.title.alternativeАнализ влияния параметров обработки звукового сигнала на качество распознавания голосовых командuk
dc.typeArticleuk
thesis.degree.level-uk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
5.pdf
Розмір:
664.04 KB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
1.71 KB
Формат:
Item-specific license agreed upon to submission
Опис: