Аналіз емоційного контексту зображень із використанням сучасних архітектур глибокого навчання

Вантажиться...
Ескіз

Дата

2025

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Дипломна робота: 85 с., 29 рис., 10 табл., 44 посилань, 1 додаток. Об’єктом дослідження є емоційний контекст зображень, що входять до складу анотованого датасету. Предметом дослідження є глибокі нейронні мережі, мультимодальні моделі, застосовані до задачі класифікації емоційного контексту в зображеннях. Метою роботи є порівняння підходів та визначення найоптимальнішого підходу до автоматичного визначення емоцій в зображеннях на основі візуальних, семантичних і мультимодальних ознак. В результаті виконання роботи реалізовано та протестовано три архітектурні рішення – EfficientNet-B0 (візуальний підхід), CLIP ViT-B/32 (семантичний підхід), та мультимодальну ансамблеву модель (CLIP_BLIP + CNN + DeiT). Найвищі показники продемонструвала мультимодальна ансамблева модель. Новизна полягає у практичному поєднанні візуальних, текстових і семантичних ознак для емоційної класифікації зображень без використання явних текстових підказок. Рекомендації щодо використання – цей підхід може знайти застосування в системах аналізу емоційного впливу рекламних матеріалів, зокрема для оптимізації візуального контенту відповідно до цільової емоційної реакції. Також можливе використання в суміжних сферах – UXдослідженнях, медіааналітиці.

Опис

Ключові слова

аналіз емоцій, blip, clip, глибоке навчання, зображення, класифікація, мультимодальність

Бібліографічний опис

Яхненко, В. Ю. Аналіз емоційного контексту зображень із використанням сучасних архітектур глибокого навчання : дипломна робота … бакалавра : 122 Комп'ютерні науки / Яхненко Владислава Юріївна. – Київ, 2025. – 102 с.

ORCID

DOI