Аналіз емоційного контексту зображень із використанням сучасних архітектур глибокого навчання
Вантажиться...
Дата
2025
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Дипломна робота: 85 с., 29 рис., 10 табл., 44 посилань, 1 додаток.
Об’єктом дослідження є емоційний контекст зображень, що входять до складу анотованого датасету. Предметом дослідження є глибокі нейронні мережі, мультимодальні моделі, застосовані до задачі класифікації емоційного контексту в зображеннях. Метою роботи є порівняння підходів та визначення найоптимальнішого підходу до автоматичного визначення емоцій в зображеннях на основі візуальних, семантичних і мультимодальних ознак. В результаті виконання роботи реалізовано та протестовано три архітектурні рішення – EfficientNet-B0 (візуальний підхід), CLIP ViT-B/32 (семантичний підхід), та мультимодальну ансамблеву модель (CLIP_BLIP + CNN + DeiT). Найвищі показники продемонструвала мультимодальна ансамблева модель. Новизна полягає у практичному поєднанні візуальних, текстових і семантичних ознак для емоційної класифікації зображень без використання явних текстових підказок. Рекомендації щодо використання – цей підхід може знайти застосування в системах аналізу емоційного впливу рекламних матеріалів, зокрема для оптимізації візуального контенту відповідно до цільової емоційної реакції. Також можливе використання в суміжних сферах – UXдослідженнях, медіааналітиці.
Опис
Ключові слова
аналіз емоцій, blip, clip, глибоке навчання, зображення, класифікація, мультимодальність
Бібліографічний опис
Яхненко, В. Ю. Аналіз емоційного контексту зображень із використанням сучасних архітектур глибокого навчання : дипломна робота … бакалавра : 122 Комп'ютерні науки / Яхненко Владислава Юріївна. – Київ, 2025. – 102 с.