Застосування методів штучного інтелекту в задачі автоматичного розпізнавання мовлення

dc.contributor.advisorЗайченко, Юрій Петрович
dc.contributor.authorБех, Петро Васильович
dc.date.accessioned2019-01-29T11:09:53Z
dc.date.available2019-01-29T11:09:53Z
dc.date.issued2018
dc.description.abstractenMaster’s thesis: 133 p., 17 fig., 23 tabl., 39 ref., 1 appendix. Object of research: algorithms of automatic speech recognition. Subject of study: natural languages processing. Objectives of the study: creation of a system for making text records of meetings. Tasks of the work: to develop an artificial neural network for automatic speech recognition, that is, to develop an information system with a web interface that could, after a user's command, perform automatic speech recognition from a specific container file, and provide an indexed text search in already processed records. During the work, the analysis of modern audio formats and methods for recognition of information signals was done; among the formats MPEG-1 Layer 3 was chosen as the most popular, and among the methods a combination of preprocessing through MFCC, intelligent analysis through LSTM were chosen. A network architecture was developed for the recognition of speech symbols in an audio stream, based on which a system that fulfilled the task was developed. The relevance of the project is motivated by the potential business interest and lack of similar solutions. The results of the work could be used both by commercial organizations and by enthusiasts who want to develop something similar.uk
dc.description.abstractukМагістерська дисертація: 133 с., 17 Рисунків, 23 табл., 39 джерел літератури, 1 додаток. Об’єкт дослідження: алгоритми автоматичного розпізнавання мовлення. Предмет дослідження: обробка природних мов. Цілі дослідження: створення системи з перетворення аудіофайлів у текстові записи в контексті нарад. Задачі роботи: розробити штучну нейронну мережу для автоматичного розпізнавання мовлення, тобто розробити інформаційну систему з веб- інтерфейсом, що могла б за командою користувача провести автоматичне розпізнавання усного мовлення з певного файлу-контейнера, а також надавати можливість індексованого пошуку тексту в уже оброблених записах. Під час виконання роботи було проведено аналіз сучасних аудіоформатів та методів з розпізнавання інформаційних сигналів, серед методів була обрана комбінація попередньої обробки через MFCC, інтелектуального аналізу через LSTM. Була розроблена архітектура мережі для розпізнавання мовних символів у звуковому потоці. Актуальність проекту мотивується відсутністю аналогічних рішень і потенційною зацікавленістю з боку бізнесу. Результати роботи можуть бути використані як комерційними організаціями, так і ентузіастами, що прагнуть розробити щось подібне.uk
dc.format.page133 с.uk
dc.identifier.citationБех, П. В. Застосування методів штучного інтелекту в задачі автоматичного розпізнавання мовлення : магістерська дис.: 122 Комп'ютерні науки / Бех Петро Васильович. – Київ, 2018. – 133 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/26099
dc.language.isoukuk
dc.publisher.placeКиївuk
dc.subjectаналіз MP3uk
dc.subjectавтоматичне розпізнавання мовленняuk
dc.subjectPythonuk
dc.subjecttensorflowuk
dc.subjectKerasuk
dc.subjectMFCCuk
dc.subjectLSTMuk
dc.subjectRNNuk
dc.subjectCTCuk
dc.subjectMP3 analysisuk
dc.subjectautomatic speech recognitionuk
dc.subject.udc004.896uk
dc.titleЗастосування методів штучного інтелекту в задачі автоматичного розпізнавання мовленняuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Bekh_magistr.pdf
Розмір:
2.32 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
7.74 KB
Формат:
Item-specific license agreed upon to submission
Опис: