Інтелектуальна система розпізнавання мовлення у вивченні іншомовних слів на основі машинного навчання
Вантажиться...
Дата
2020-12
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Актуальність теми. Сьогодні знання іноземних мов, а тим більше англійської, є неохідним. Якщо ж мову можна вивчити за допомогою різноманітних онлайн курсів, то ситуація з вимовую є складнішою. Є декілька варіантів тренування вимови. Перший варіант – слухати та повторювати. Цей варіант не є дуже ефективним, оскільки людині складно почути свою вимову зі сторони, а тим більше оцінити ії. Другий спосіб – курси іноземних мов. Цей варіант ефективний, але доволі дорогий. Третій підхід – використання спеціалізованих застосувань для спілкування з носіями мови для її вивчення. Третій варіант є дуже ефективним, але має декілька недоліків. По перше, складно знайти людину яка дійсно зацікавлена у тому, щоб допомогти з постановкою вимови, оскільки такі застосунки, в основному, призначені для того, щоб люди просто спілкувалися на різноманітні теми і не замислювались над постановкою вимови. По друге, є люди, яким некомфортно спілкуватись з незнайомими людьми і це є значною перешкодою для вивчення мови за допомогою таких застосунків.
Таким чином вирішення задачі постановки вимови за допомогою інтелектуальної системи, яка має можливість аналізувати вимову користувача є дуже актуальною в наш час.
Зв’язок роботи з науковими програмами, планами, темами. Робота виконувалась на кафедрі автоматизованих систем обробки інформації та управління факультету обчислювальної техніки Національного технічного університету України «Київський політехнічний інститут ім. Ігоря Сікорського» в рамках теми «Інтелектуальна система розпізнавання мовлення у вивченні іншомовних слів на основі машинного навчання»
Метою дослідження є покращення процесу постановки вимови шляхом розробки архітектури програмного забезпечення, що буде порівнювати два аудіофайли для перевірки правильності вимови іншомовних слів. Перший аудіофайл зчитується з мікрофону користувача, другий генерується системою за допомогою технології Text-to-Speech.
Для досягнення поставленої мети необхідно виконати наступні завдання:
– провести аналіз існуючих рішень даної проблеми та наявних аналогів;
– розробити архітектуру програмного забезпечення для постановки вимови;
– реалізувати зчитування звуку з мікрофону користувача та збереження його в аудіофайл;
– реалізувати генерацію аудіофайлу з тексту за допомогою технології Text-to-Speech;
– реалізувати генерацію текста з аудіофайла за допомогою технології Speech-to-Text;
– реалізувати алгоритм попередньої обробки аудіофайлів для їх синхронізації;
– реалізувати алгоритм порівняння двох аудіофайлів для виявлення помилки у вимові;
– проаналізувати результати роботи системи.
Об’єкт дослідження. Процес визначення правильності вимови шляхом порівняння аудіофайлів.
Предметом дослідження є алгоритми і методи для розпізнавання мовлення, а також методи для порівняння аудіофайлів.
Наукова новизна одержаних результатів. Найбільш суттєвими науковими результатами магістерської дисертації є:
– запропоновано архітектурне рішення для побудови інтелектуальної системи розпізнавання мовлення для постановки вимови;
– вперше розроблена система постановки вимови, що, на відміну від подібних систем, є агностичною до кількості та набору слів та фраз, а також є точнішою, оскільки порівняння виконується безпосередньо на аудіофайлах.
Практичне значення отриманих результатів. Розроблена система використовується у застосуванні для вивчення іноземних слів для постановки вимови.
Публікації. Матеріали роботи опубліковані в збірнику тез ІV всеукраїнської науково-практичної конференції молодих вчених та студентів «Інформаційні системи та технології управління» (ІСТУ-2020) Худа А. О., Халус О. А. «Метод порівняння аудіофайлів у системі для вивчення іноземних слів».
Опис
Ключові слова
розпізнавання мовлення, іноземні мови, порівняння аудіо, speech recognition, foreign languages, audio comparisons, Text-to-Speech, Speech-to-Text
Бібліографічний опис
Худа, А. О. Інтелектуальна система розпізнавання мовлення у вивченні іншомовних слів на основі машинного навчання : магістерська дис. : 121 Інженерія програмного забезпечення / Худа Анна Олександрівна. – Київ, 2020. – 100 с.