Застосування методів штучного інтелекту в задачі автоматичного розпізнавання мовлення
dc.contributor.advisor | Зайченко, Юрій Петрович | |
dc.contributor.author | Бех, Петро Васильович | |
dc.date.accessioned | 2019-01-29T11:09:53Z | |
dc.date.available | 2019-01-29T11:09:53Z | |
dc.date.issued | 2018 | |
dc.description.abstracten | Master’s thesis: 133 p., 17 fig., 23 tabl., 39 ref., 1 appendix. Object of research: algorithms of automatic speech recognition. Subject of study: natural languages processing. Objectives of the study: creation of a system for making text records of meetings. Tasks of the work: to develop an artificial neural network for automatic speech recognition, that is, to develop an information system with a web interface that could, after a user's command, perform automatic speech recognition from a specific container file, and provide an indexed text search in already processed records. During the work, the analysis of modern audio formats and methods for recognition of information signals was done; among the formats MPEG-1 Layer 3 was chosen as the most popular, and among the methods a combination of preprocessing through MFCC, intelligent analysis through LSTM were chosen. A network architecture was developed for the recognition of speech symbols in an audio stream, based on which a system that fulfilled the task was developed. The relevance of the project is motivated by the potential business interest and lack of similar solutions. The results of the work could be used both by commercial organizations and by enthusiasts who want to develop something similar. | uk |
dc.description.abstractuk | Магістерська дисертація: 133 с., 17 Рисунків, 23 табл., 39 джерел літератури, 1 додаток. Об’єкт дослідження: алгоритми автоматичного розпізнавання мовлення. Предмет дослідження: обробка природних мов. Цілі дослідження: створення системи з перетворення аудіофайлів у текстові записи в контексті нарад. Задачі роботи: розробити штучну нейронну мережу для автоматичного розпізнавання мовлення, тобто розробити інформаційну систему з веб- інтерфейсом, що могла б за командою користувача провести автоматичне розпізнавання усного мовлення з певного файлу-контейнера, а також надавати можливість індексованого пошуку тексту в уже оброблених записах. Під час виконання роботи було проведено аналіз сучасних аудіоформатів та методів з розпізнавання інформаційних сигналів, серед методів була обрана комбінація попередньої обробки через MFCC, інтелектуального аналізу через LSTM. Була розроблена архітектура мережі для розпізнавання мовних символів у звуковому потоці. Актуальність проекту мотивується відсутністю аналогічних рішень і потенційною зацікавленістю з боку бізнесу. Результати роботи можуть бути використані як комерційними організаціями, так і ентузіастами, що прагнуть розробити щось подібне. | uk |
dc.format.page | 133 с. | uk |
dc.identifier.citation | Бех, П. В. Застосування методів штучного інтелекту в задачі автоматичного розпізнавання мовлення : магістерська дис.: 122 Комп'ютерні науки / Бех Петро Васильович. – Київ, 2018. – 133 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/26099 | |
dc.language.iso | uk | uk |
dc.publisher.place | Київ | uk |
dc.subject | аналіз MP3 | uk |
dc.subject | автоматичне розпізнавання мовлення | uk |
dc.subject | Python | uk |
dc.subject | tensorflow | uk |
dc.subject | Keras | uk |
dc.subject | MFCC | uk |
dc.subject | LSTM | uk |
dc.subject | RNN | uk |
dc.subject | CTC | uk |
dc.subject | MP3 analysis | uk |
dc.subject | automatic speech recognition | uk |
dc.subject.udc | 004.896 | uk |
dc.title | Застосування методів штучного інтелекту в задачі автоматичного розпізнавання мовлення | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Bekh_magistr.pdf
- Розмір:
- 2.32 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 7.74 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: