Алгоритмічно-програмний метод визначення активного мовця

dc.contributor.advisorХіцко, Яна Володимирівна
dc.contributor.authorНікітін, Олександр Олександрович
dc.date.accessioned2024-08-22T09:25:00Z
dc.date.available2024-08-22T09:25:00Z
dc.date.issued2024
dc.description.abstractДана магістерська дисертація присвячена розробленню та реалізації алгоритмічно-програмного методу для визначення активного мовця. В ході даної магістерської дисертації було проаналізовано ряд існуючих способів та методів виявлення активного мовця, запропоновано новий метод з мультимодальною архітектурою, яка інтегрує аудіо, відео та поведінкові ознаки за допомогою глибоких нейронних мереж, такий підхід забезпечує рівень точності виявлення активного мовця до 93%, що перевищує точність проаналізованих аналогічних методів на 2-3%. У даній магістерській дисертації розроблено програмне забезпечення для визначення активного мовця.
dc.description.abstractotherThis master's thesis is devoted to the development and implementation of an algorithmic and software method for active speaker detection. In the course of this master's thesis, a number of existing methods and techniques for active speaker detection were analyzed, a new method with a multimodal architecture that integrates audio, video and behavioral features using deep neural networks was proposed, this approach provides an accuracy level of active speaker detection up to 93%, which exceeds the accuracy of analyzed similar methods by 2-3%. The software for active speaker detection has been developed in this master's thesis.
dc.format.extent134 с.
dc.identifier.citationНікітін, О. О. Алгоритмічно-програмний метод визначення активного мовця : магістерська дис. : 121 Інженерія програмного забезпечення / Хіцко Яна Володимирівна. – Київ, 2024. – 134 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/68476
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectвиявлення активного мовця
dc.subjectмультимодальний аналіз
dc.subjectглибокі нейронні мережі
dc.subjectаудіо-відео інтеграція
dc.subjectмультимодальні системи
dc.subject.udc004.93
dc.titleАлгоритмічно-програмний метод визначення активного мовця
dc.typeMaster Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Nikitin_magistr.pdf
Розмір:
2.37 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: