Математичне та програмне забезпечення системи розпізнавання емоцій за аудіозаписами
Вантажиться...
Дата
2023
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Дисертацію виконано на 81 аркушах, вона містить 2 додатки та перелік посилань на використані джерела з 22 найменувань. У роботі наведено 40 рисунків та 2 таблиці.
Актуальність теми. Технології сучасності стрімко розвиваються. Сьогодні потужність обчислювальної техніки сильно виросла порівняно з попереднім століттям. Розвиток машинного навчання припадає ще на 60-ті роки минулого століття і швидкість розвитку цієї галузі зростає з кожним роком в геометричній прогресії. Протягом останніх двох десятиліть ця галузь є однією із провідних у комп’ютерних науках. Задачі розпізнавання вирішені використанням нейронних мереж є унікальними. Використання нейронних мереж у багатьох сферах стрімко покращує прогрес. Дана робота, про розпізнавання емоцій людини за аудіозаписами спрямована на вирішення проблем галузях: військовій, розважальній, освітній та медичній.
Зв’язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконувалась згідно з планом науково-дослідних робіт кафедри прикладної математики Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського».
Мета і задачі дослідження. Метою дисертаційної роботи є розробка математичного та програмного забезпечення системи розпізнавання емоцій за аудіозаписами. Для досягнення цієї мети необхідно вирішити наступні задачі:
- дослідити методи навчання нейронних мереж;
- розглянути і проаналізувати архітектури та принципи організації нейронних мереж та методів вирішення задач класифікації;
- способи оптимізації параметрів згорткових мереж;
- запропонувати структуру системи класифікації аудіозаписів;
- розробити модель програмного забезпечення з запропонованою структурою;
- провести експериментальне дослідження характеристик системи.
Об’єктом дослідження є способи організації засобів машинного навчання для розпізнавання емоцій за аудіозаписами.
Теоретичні інструменти:
- методи і алгоритми реалізації архітектур нейронних мереж: нейронні мережі, аналіз та класифікація даних за заданими параметрами; обрання ознак;
- методи оптимізації гіперпараметрів: гіперпараметри, оптимізація, пошук архітектури нейронної мережі, автоналаштування; обрання моделі;
Існуючі засоби: класи, ознаки, характеристики, область застосування, вартість володіння.
Предмет дослідження:
Математичне та програмне забезпечення системи розпізнавання емоцій за аудіозаписами на основі нейромережевої моделі.
Застосування нейронних мереж на етапі попереднього тренування для розпізнавання емоцій за аудіозаписами, порівняльний аналіз методів оптимізації, що використовуються при навчанні нейронних мереж.
Методи дослідження. Для розв’язання поставленої задачі використовувались такі методи: методи машинного навчання (для розробки моделі нейронної мережі); методи оптимізації (для пошуку найкращого налаштування системи); методи обробки даних (для попередньої підготовки вихідних даних); методи теорії алгоритмів та програмування (для програмної реалізації розроблених алгоритмів).
Наукова новизна одержаних результатів складається з таких положень:
1) вперше застосовано та поєднано системну інженерію, включено методи та моделі Data Science, які використовуються для реалізації системи розпізнавання емоцій людини за аудіозаписами;
2) запропоновано використання інтегрованої моделі класифікації емоцій за аудіозаписами на основі згорткових нейронних мереж з автоматизованим підбором гіперпараметрів.
Практичне значення одержаних результатів. Полягає в тому, що розроблена система розпізнавання емоцій за аудіозаписами на основі згорткової нейронної мережі, яка може використовуватись для аналізу розмови та емоційного стану людини, що в подальшому можна використовувати в рекомендаційних системах, військовій справі і тд.
Апробація результатів дисертації. Основні положення й результати роботи дисертації доповідались та опубліковані у матеріалах XV наукової конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг - ПМК-2022» ( Київ 16-17 листопада 2022 року).
Публікації. Результати дисертації викладено в науковій праці: тези «Автоматизація підбору гіперпарметрів lstm для задачі розпізнавання емоцій за аудіозаписами» на XV конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг - ПМК-2022»
Опис
Ключові слова
згорткова нейронна мережа, розпізнавання емоцій, класифікація, регуляризація, навчання мережі, алгоритми оптимізації, оптимізація гіперпараметрів
Бібліографічний опис
Коваленко, О. П. Математичне та програмне забезпечення системи розпізнавання емоцій за аудіозаписами : магістерська дис. : 113 Прикладна математика / Коваленко Олександра Петрівна. – Київ, 2023. – 98 с.