Метод визначення ключових слів в аудіопотоці

dc.contributor.advisorТерейковський, Ігор Анатолійович
dc.contributor.authorОстапчук, Степан Ігорович
dc.date.accessioned2022-01-19T09:33:40Z
dc.date.available2022-01-19T09:33:40Z
dc.date.issued2021
dc.description.abstractenActuality of theme. Computer technology has become firmly entrenched in people's lives. Today they are used in almost every home. Computers simplify our lives and automate many things we used to do on our own. Recognition of keywords in the audio stream is a topical issue precisely because - it will facilitate communication between man and technology - there are already so-called "smart homes", which are controlled by voice commands. However, voice commands are not the only place where keyword searches can be useful. The task of finding keywords has recently taken one of the important places in speech recognition systems. Existing keyword search systems in the audio stream are still far from perfect: limited vocabulary, high error rate, speaker-specific settings - this is by no means a complete list of problems to be solved. It is well known that human language is characterized by a high degree of variability. This is due to several reasons. The object of this study is the process of finding keywords in an audio file and using this method. The subject of the study is the method of identifying keywords in the audio stream. The aim of the work is to develop an application for finding keywords in the audio stream, using a neural network that recognizes words in the stream. To achieve this goal, the following research objectives are identified: 1. To analyze analogous programs; 2. To determine the functionality of the developed method; 3. Determine the non-functional requirements of the developed method; 4. Analyze modern approaches and choose the best for application development; 5. Develop the structure and functionality of the method; 6. Develop a ready-made application and fill it with demonstration content. The scientific novelty is as follows: A method of searching for keywords in the audio stream is proposed. The practical value of the results obtained in the work is that the proposed method allows you to search for keywords in the audio stream. Approbation of work. The main provisions and results of the work were presented and discussed at the XIV scientific conference of undergraduates and graduate students "Applied Mathematics and Computing" PMK-2021 (Kyiv, November 17-19, 2021), and at the V international scientific-practical conference TOPICAL ISSUES OF MODERN SCIENCE, SOCIETY AND EDUCATION ”(Kharkiv, November 28-30, 2021). Structure and scope of work. The master's dissertation consists of an introduction, four chapters and conclusions. The introduction presents a general description of the work, assesses the current state of the problem, substantiates the relevance of research, formulates the purpose and objectives of research and shows the practical value of the work. The first section discusses the basic techniques of keyword search in the audio stream, the software that implements them, their advantages and disadvantages. The second section provides information on the methods, algorithms and tools used to process the audio stream in the master's thesis. The third section describes the developed method and stages of its implementation. The fourth section contains testing of this method in order to prove the correctness of the work. The conclusions present the results of the work. The work is presented on 80 sheets, contains links to a list of used literature sources.uk
dc.description.abstractukАктуальність теми. Комп'ютерні технології міцно увійшли до життя людей. Нині вони використовуються майже у кожному будинку. Комп'ютери спрощують нам життя та автоматизують багато справ, які ми раніше робили самостійно. Розпізнавання ключових слів в аудіопотоці є актуальною темою саме тому – воно спростить спілкування між людиною та технікою – вже зараз є так звані “розумні будинки”, які керуються голосовими командами. Проте голосові команди – не єдине місце, де пошук ключових слів може стати в нагоді. Завдання пошуку ключових слів останнім часом зайняло одне з важливих місць в системах розпізнавання мовлення. Існуючі системи пошуку ключових слів в аудіопотоці на даний момент ще далекі від досконалості: обмежений обсяг словника, високий відсоток помилок, налаштування на конкретного диктора – ось далеко не повний перелік проблем, які належить вирішити. Добре відомо, що мова людини характеризується високою ступенем мінливості. Це зумовлено кількома причинами. Об’єктом дослідження даної роботи є процес знаходження ключових слів в аудіо файлі та використання цього методу. Предметом дослідження є методика виявлення ключових слів в аудіопотоці. Мета роботи є розробка застосунку для знаходження ключових слів в аудіопотоці, за допомогою нейронної мережі, яка розпізнає слова в потоці. Для досягнення поставленої мети визначено такі задачі дослідження: 1. Провести аналіз програм-аналогів; 2. Визначити функціональні можливості розроблюваного методу; 3. Визначити нефункціональні вимоги розроблюваного методу; 4. Проаналізувати сучасні підходи та обрати оптимальний для розробки додатку; 5. Розробити структуру та функціонал методу; 6. Розробити готовий додаток та наповнити його демонстраційним контентом. Наукова новизна полягає в наступному: Запропоновано метод пошуку ключових слів в аудіопотоці. Практична цінність отриманих в роботі результатів полягає в тому, що запропонований метод дозволяє шукати ключові слова в аудіопотоці. Апробація роботи. Основні положення і результати роботи були представлені та обговорювались на XIV науковій конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг» ПМК-2021 (Київ, 17-19 листопада 2021 р.), та на V міжнародній науково-практичній конференції “TOPICAL ISSUES OF MODERN SCIENCE, SOCIETY AND EDUCATION”(Харків, 28-30 листопада 2021 р.) . Структура та обсяг роботи. Магістерська дисертація складається з вступу, чотирьх розділів та висновків. У вступі подано загальну характеристику роботи, зроблено оцінку сучасного стану проблеми, обґрунтовано актуальність напрямку досліджень, сформульовано мету і задачі досліджень та показано практичну цінність роботи. У першому розділі розглянуто основні техніки пошуку ключових слів в аудіопотоці , програмне забезпечення, яке їх реалізує, їх переваги та недоліки. У другому розділі наведено відомості про методи, алгоритми та інструменти, які використовуються для обробки аудіопотоку в магістерській роботі. У третьому розділі подано опис розробленого методу та етапів його реалізації. У четвертому розділі міститься тестування даного методу з метою доведення правильності роботи. У висновках представлені результати проведеної роботи. Робота представлена на 80 аркушах, містить посилання на список використаних літературних джерелuk
dc.format.page89 с.uk
dc.identifier.citationОстапчук, С. І. Метод визначення ключових слів в аудіопотоці : магістерська дис. : Комп’ютерна інженерія / Остапчук Степан Ігорович. – Київ, 2021. – 89 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/45942
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectключові словаuk
dc.subjectаудіопотікuk
dc.subjectkey wordsuk
dc.subjectaudio flowuk
dc.subject.udc004.934.1uk
dc.titleМетод визначення ключових слів в аудіопотоціuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Ostapchuk_magistr.pdf
Розмір:
1.48 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: