Генерація цільового голосу людини з використанням нейронних мереж

dc.contributor.advisorРодіонов, Андрій Миколайович
dc.contributor.authorМаксименко, Олег Анатолійович
dc.date.accessioned2020-02-04T08:58:42Z
dc.date.available2020-02-04T08:58:42Z
dc.date.issued2019-06
dc.description.abstractenNowadays special biometric identification and verification systems using unique physiological and behavioral properties of a person (DNA, iris, face, fingerprints, etc.) are created in order to increase the level of reliability and security of access. The popularity of these technologies caused by the fact that they are less prone to attack, because it is difficult to compromise systems. The purpose of this work was to synthesize the person's speech from the text preserving his/her individual characteristics with the help of a neural network. The object of the study is neural networks and their architectures. The subject is the synthesis of speech signals with the help of machine learning methods and neural networks. The achievement of the goal and the solution of the tasks has been facilitated by the use of the complex of theoretical and empirical research methods. The paper proposes a neural network that can be re-configured for a short period of time to generate new voices, while requiring a small amount of data to adapt. We investigated the models of convolutional neural networks with the attention mechanism that can replace recurrent neural networks in solving the problems of synthesizing intelligible and approximate to person's natural speech, preserving individual voice and pronunciation. In the first chapter, the main advantages and disadvantages of approaches to modeling processes of synthesis and modification of speech signals have been considered, as well as concrete examples of implementation of these approaches. The second section describes how to process speech signals in order to use them to extract useful information from signals, which can be used as the characteristic feature for training the neural network. Also we considered the algorithm that reconstructs the signal out of these features. The third section describes in detail the process of constructing the architecture of the neural network, depicts the main organizational steps of conducting experimental research to achieve the goal set in this paper. A subjective and objective evaluation of the quality of the proposed neural network has been carried out. The practical value of the results obtained consists in the development of an individual's speech synthesis neural network, which can be used as data output interface in many systems, as well as the means of testing biometric voice recognition systems.uk
dc.description.abstractukВ умовах сьогодення з метою підвищення рівня надійності і безпеки доступу створюються спеціальні біометричні системи ідентифікації та верифікації, що використовують унікальні фізіологічні та поведінкові властивості людини (ДНК, райдужна оболонка ока, обличчя, відбитки пальців тощо). Популярність цих технологій пояснюється тим, що вони менш схильні наражатися на атаки, оскільки організувати атаки на них досить складно. Метою даної роботи було синтезування мовлення людини з тексту зі збереженням його індивідуальних особливостей за допомогою нейронної мережі. Об’єктом дослідження є нейронні мережі та їхні архітектури. Предметом – синтез мовних сигналів із використанням методів машинного навчання та нейронних мереж. Досягненню мети і вирішенню поставлених завдань сприяло використання комплексу теоретичних та емпіричних методів дослідження. У роботі запропоновано нейронну мережу, яка може за короткий проміжок часу переналаштовуватися для генерації нових голосів, потребуючи при цьому невеликий об'єм даних для адаптації. Було досліджено моделі згорткових нейронних мереж з механізмом уваги, які можуть замінити рекурентні нейронні мережі у вирішенні задач синтезу розбірливого і наближеного до природного мовлення людини зі збереженням індивідуального голосу та вимови. У першому розділі було розглянуто основні переваги та недоліки підходів до моделювання процесів синтезу та модифікації мовних сигналів, а також наведено конкретні приклади реалізацій цих підходів. У другому розділі було описано способи обробки мовних сигналів з метою використання їх для виділення корисної інформації з сигналів, яку можна використати в якості характерних ознак для тренування нейронної мережі. Також розглянуто алгоритм, який дозволяє навпаки з цих ознак відтворити сигнал. У третьому розділі детально охарактеризовано процес побудови архітектури нейронної мережі, описано основні організаційні кроки проведення експериментальних досліджень для досягнення поставленої в даній роботі мети. Після цього було здійснено суб’єктивне та об’єктивне оцінювання якості роботи запропонованої нейронної мережі. Практичне значення одержаних результатів полягає у розробці нейронної мережі синтезу особистісного мовлення за текстом, яку можна використовувати як інтерфейс виведення даних для багатьох систем, а також в якості засобу перевірки біометричних систем ідентифікації за голосом.uk
dc.format.page62 с.uk
dc.identifier.citationМаксименко, О. А. Генерація цільового голосу людини з використанням нейронних мереж : дипломна робота ... бакалавра : 6.170101 Безпека інформаційних і комунікаційних систем / Максименко Олег Анатолійович. – Київ, 2019. – 62 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/31331
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectнейронна мережаuk
dc.subjectмашинне навчанняuk
dc.subjectрозпізнавання мовцяuk
dc.subjectгенерація мовленняuk
dc.subjectобробка мовних сигналівuk
dc.subjectголосова конверсіяuk
dc.subjectneural networkuk
dc.subjectmachine learninguk
dc.subjectspeaker recognitionuk
dc.subjectspeech synthesisuk
dc.subjectspeech signal processinguk
dc.subjectvoice conversionuk
dc.titleГенерація цільового голосу людини з використанням нейронних мережuk
dc.typeBachelor Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Maksymenko_bakalavr.pdf
Розмір:
1.54 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.06 KB
Формат:
Item-specific license agreed upon to submission
Опис: