Програмне та математичне забезпечення для системи перетворення аудіомовлення в текстову інформацію

dc.contributor.advisorНовінський, Валерій Петрович
dc.contributor.authorАбушек, Дмитро Андрійович
dc.date.accessioned2023-01-10T09:17:35Z
dc.date.available2023-01-10T09:17:35Z
dc.date.issued2021-12
dc.description.abstractenExplanatory note size is 171 pages, it contains 25 illustrations, 9 tables, 4 applications. Topicality. Speech recognition systems are used mainly by people with physical disabilities. For example, people who have lost both their hands or lost their sight and are still used to using Braille. Such programs allow you to voice control the computer or type any text. Some of these programs store the user's voice data after each session so that he can start working from where he left off. From the above we can conclude about the relevance of this work. The aim of the study. Improving the efficiency of language recognition algorithms Object of research: audiovisual language recognition system. Subject of research: software and mathematical software of audiovisual language recognition system. To achieve this goal, the following tasks were formulated: - review existing solutions; - build a general scheme of the model of speech recognition system; - implement software for audiovisual speech recognition system. The scientific novelty The obtained results are that a toolkit (appropriate software and mathematical software) was developed, which contains an ant clustering algorithm that allows to reduce the number of states without losing the quality of information recognition. The practical value of this software is to help people with disabilities who may have lost both hands or have vision problems who previously used Braille. Also of practical importance is to reduce typing time and automate this process during notation of conferences / court hearings. Provide fast transfer from video to text. Relationship with working with scientific programs, plans, topics. Work was performed at the Department of Informatics and Software Engineering of the National Technical University of Ukraine «Kyiv Polytechnic Institute. Igor Sikorsky». Approbation. The scientific provisions of the dissertation were tested at the International Scientific and Practical Conference. «SCIENCE AND PRACTICE, ACTUAL PROBLEMS, INNOVATIONS» Publications. The scientific provisions of the dissertation were tested at the International Scientific and Practical Conference. «SCIENCE AND PRACTICE, ACTUAL PROBLEMS, INNOVATIONS»uk
dc.description.abstractukРозмір пояснювальної записки – 171 аркушів, містить 25 ілюстрацій, 9 таблиць, 4 додатки Актуальність теми. Системи розпізнавання мови використовують переважно люди з фізичними відхиленнями. Наприклад, люди, які втратили обидві свої руки, або втратили зір і ще звикли використовувати брайлевську печатку. Такі програми дозволяють голосом управляти роботою комп'ютера або набирати будь-який текст. Деякі такі програми після кожної сесії зберігають голосові дані користувача, щоб той потім міг почати роботу з того місця, де зупинився. З вищевикладеного можна зробити висновок про актуальність даної роботи. Мета дослідження. Підвищення ефективності роботи алгоритмів розпізнавання мови Об’єкт дослідження: аудіовізуальна система розпізнавання мови. Предмет дослідження: програмне та математичне забезпечення аудіовізуальної системи розпізнавання мови Для реалізації поставленої мети сформульовані наступні завдання: – виконати огляд існуючих рішень; – побудувати загальну схему моделі системи розпізнавання мови; – реалізувати программне забезпечення для аудіовізуальної системи розпізновання мови. Наукова новизна отриманих результатів полягає в тому, що було розроблено інструментарій (відповідне програмне та математичне забезпечення), який містить мурашиний алгоритм кластерізації що дає змогу скоротити кількість станів без втрати якості розпізнавання інформації. Практичне значення. Практична значимість данного программного забезпечення полягае в тому,щоби допомогти людям з фізичними вадами, які могли втратити обидві руки чи мають проблеми із зором,які раніше використовували брайлевську печатку.Також практична значимість полягає в тому щоби скоротити час набирання тексту та автоматизувати цей процесс під час нотування конференцій/судових засідань.Забезпечити швидкий перенос із відео в текст. Зв’язок з науковими програмами, планами, темами. Робота виконувалась на кафедрі інформатики та програмної інженерії Національного технічного університету України "Київський політехнічний інститут імені Ігоря Сікорського". Апробація. Наукові положення дисертації пройшли апробацію на Міжнародній науково-практичній конференції «SCIENCE AND PRACTICE, ACTUAL PROBLEMS, INNOVATIONS». Публікації. Наукові положення дисертації опубліковані в: Абушек Д. А., Дорогий Я. Ю. МУРАШИНИЙ АЛГОРИТМ КЛАСТЕРИЗАЦІЇ //SCIENCE AND PRACTICE, ACTUAL PROBLEMS, INNOVATIONS. – 09-12 листопада 2021р. Амстердам, Нідерланди. – Т. 8. – Р. 473.uk
dc.format.page171 с.uk
dc.identifier.citationАбушек, Д. А. Програмне та математичне забезпечення для системи перетворення аудіомовлення в текстову інформацію : магістерська дис. : 121 Інженерія програмного забезпечення / Абушек Дмитро Андрійович. – Київ, 2021. – 171 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/51779
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectмашинне навчанняuk
dc.subjectприхована марківська модельuk
dc.subjectалгоритм навчанняuk
dc.subjectоптимізаціяuk
dc.subjectалгоритм зворотнього поширення помилкиuk
dc.subjectмурашиний алгоритм кластеризаціїuk
dc.subjectmachine learninguk
dc.subjecthidden Markov modeluk
dc.subjectlearning algorithmuk
dc.subjectoptimization,uk
dc.subjecterror backpropagation algorithmuk
dc.subjectant clustering algorithmuk
dc.subject.udc004.852uk
dc.titleПрограмне та математичне забезпечення для системи перетворення аудіомовлення в текстову інформаціюuk
dc.title.alternativeSoftware and Mathematical Implementations for Converting Audio Broadcast into Text Informationuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Abushek_magistr.pdf
Розмір:
5 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: