Інтелектуальна система розпізнавання мовлення у вивченні іншомовних слів на основі машинного навчання

dc.contributor.advisorХалус, Олена Андріївна
dc.contributor.authorХуда, Анна Олександрівна
dc.date.accessioned2021-03-15T15:44:38Z
dc.date.available2021-03-15T15:44:38Z
dc.date.issued2020-12
dc.description.abstractenActuality. Today, knowledge of foreign languages, especially English, is essential. If the language can be learned with the help of various online courses, the situation with pronunciation is more complicated. There are several pronunciation training options. The first option is to listen and repeat. This option is not very effective, because it is difficult for a person to hear his pronunciation from the side, much less evaluate it. The second way is foreign language courses. This option is effective, but quite expensive. The third approach is to use specialized applications to communicate with native speakers to study it. The third option is very effective, but has several disadvantages. First of all, it is difficult to find a person who is really interested in helping with pronunciation, because such applications are mainly intended for people to simply communicate on various topics and not think about pronunciation. Secondly, there are people who are uncomfortable communicating with strangers and this is a significant obstacle to learning a language through such applications. Thus, solving the problem of pronunciation with the help of an intelligent system that has the ability to analyze the user's pronunciation is very relevant today. Relationship with working with scientific programs, plans, topics. The work was performed at the Department of Automated Information Processing and Management Systems of the Faculty of Computer Engineering of The National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute" within the work “Intelligent speech recognition system in the process of learning foreign words based on machine learning”. The aim of the study is to develop a software architecture that will compare two audio files to check the correct pronunciation of foreign words. The first audio file is read from the user's microphone, the second is generated by the system using Text-to-Speech technology. To achieve this goal it is necessary to perform the following tasks: – to analyze the existing solutions of this problem and existing analogues; – develop a software architecture for pronunciation improvement; – implement reading the sound from the user's microphone and saving it to an audio file; – implement the generation of an audio file from text using Text-to-Speech technology; – implement the generation of text from an audio file using Speech-to-Text technology; – implement an algorithm for pre-processing audio files for their synchronization; – implement an algorithm for comparing two audio files to detect an error in pronunciation; – analyze the results of the system. Object of study. The process of determining the correct pronunciation by comparing audio files. The subject of the research are re algorithms and methods for speech recognition, as well as methods for comparing audio files. Scientific novelty of the obtained results. The most significant scientific results of the master's dissertation are: – an architectural solution is proposed to build an intelligent speech recognition system for pronunciation; – the first developed pronunciation system, which, unlike similar systems, is agnostic to the number and set of words and phrases, as well as more accurate, because the comparison is performed directly on audio files. The practical significance of the results. The developed system is used in the application for the study of foreign words for improving pronunciation. Publications. Materials are published in the collection of abstracts of the IV All-Ukrainian scientific-practical conference of young scientists and students "Information systems and control technologies" (ISTU-2020) Khuda Anna, Khalus Olena "Method of comparing audio files in the system for learning foreign words".uk
dc.description.abstractukАктуальність теми. Сьогодні знання іноземних мов, а тим більше англійської, є неохідним. Якщо ж мову можна вивчити за допомогою різноманітних онлайн курсів, то ситуація з вимовую є складнішою. Є декілька варіантів тренування вимови. Перший варіант – слухати та повторювати. Цей варіант не є дуже ефективним, оскільки людині складно почути свою вимову зі сторони, а тим більше оцінити ії. Другий спосіб – курси іноземних мов. Цей варіант ефективний, але доволі дорогий. Третій підхід – використання спеціалізованих застосувань для спілкування з носіями мови для її вивчення. Третій варіант є дуже ефективним, але має декілька недоліків. По перше, складно знайти людину яка дійсно зацікавлена у тому, щоб допомогти з постановкою вимови, оскільки такі застосунки, в основному, призначені для того, щоб люди просто спілкувалися на різноманітні теми і не замислювались над постановкою вимови. По друге, є люди, яким некомфортно спілкуватись з незнайомими людьми і це є значною перешкодою для вивчення мови за допомогою таких застосунків. Таким чином вирішення задачі постановки вимови за допомогою інтелектуальної системи, яка має можливість аналізувати вимову користувача є дуже актуальною в наш час. Зв’язок роботи з науковими програмами, планами, темами. Робота виконувалась на кафедрі автоматизованих систем обробки інформації та управління факультету обчислювальної техніки Національного технічного університету України «Київський політехнічний інститут ім. Ігоря Сікорського» в рамках теми «Інтелектуальна система розпізнавання мовлення у вивченні іншомовних слів на основі машинного навчання» Метою дослідження є покращення процесу постановки вимови шляхом розробки архітектури програмного забезпечення, що буде порівнювати два аудіофайли для перевірки правильності вимови іншомовних слів. Перший аудіофайл зчитується з мікрофону користувача, другий генерується системою за допомогою технології Text-to-Speech. Для досягнення поставленої мети необхідно виконати наступні завдання: – провести аналіз існуючих рішень даної проблеми та наявних аналогів; – розробити архітектуру програмного забезпечення для постановки вимови; – реалізувати зчитування звуку з мікрофону користувача та збереження його в аудіофайл; – реалізувати генерацію аудіофайлу з тексту за допомогою технології Text-to-Speech; – реалізувати генерацію текста з аудіофайла за допомогою технології Speech-to-Text; – реалізувати алгоритм попередньої обробки аудіофайлів для їх синхронізації; – реалізувати алгоритм порівняння двох аудіофайлів для виявлення помилки у вимові; – проаналізувати результати роботи системи. Об’єкт дослідження. Процес визначення правильності вимови шляхом порівняння аудіофайлів. Предметом дослідження є алгоритми і методи для розпізнавання мовлення, а також методи для порівняння аудіофайлів. Наукова новизна одержаних результатів. Найбільш суттєвими науковими результатами магістерської дисертації є: – запропоновано архітектурне рішення для побудови інтелектуальної системи розпізнавання мовлення для постановки вимови; – вперше розроблена система постановки вимови, що, на відміну від подібних систем, є агностичною до кількості та набору слів та фраз, а також є точнішою, оскільки порівняння виконується безпосередньо на аудіофайлах. Практичне значення отриманих результатів. Розроблена система використовується у застосуванні для вивчення іноземних слів для постановки вимови. Публікації. Матеріали роботи опубліковані в збірнику тез ІV всеукраїнської науково-практичної конференції молодих вчених та студентів «Інформаційні системи та технології управління» (ІСТУ-2020) Худа А. О., Халус О. А. «Метод порівняння аудіофайлів у системі для вивчення іноземних слів».uk
dc.format.page100 с.uk
dc.identifier.citationХуда, А. О. Інтелектуальна система розпізнавання мовлення у вивченні іншомовних слів на основі машинного навчання : магістерська дис. : 121 Інженерія програмного забезпечення / Худа Анна Олександрівна. – Київ, 2020. – 100 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/39980
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectрозпізнавання мовленняuk
dc.subjectіноземні мовиuk
dc.subjectпорівняння аудіоuk
dc.subjectspeech recognitionuk
dc.subjectforeign languagesuk
dc.subjectaudio comparisonsuk
dc.subjectText-to-Speechuk
dc.subjectSpeech-to-Textuk
dc.subject.udc004.4uk
dc.titleІнтелектуальна система розпізнавання мовлення у вивченні іншомовних слів на основі машинного навчанняuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Khuda_magistr.pdf
Розмір:
1.75 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.01 KB
Формат:
Item-specific license agreed upon to submission
Опис: