Аналіз емоційного контексту зображень із використанням сучасних архітектур глибокого навчання
dc.contributor.advisor | Шаповал, Наталія Віталіївна | |
dc.contributor.author | Яхненко, Владислава Юріївна | |
dc.date.accessioned | 2025-09-09T13:00:01Z | |
dc.date.available | 2025-09-09T13:00:01Z | |
dc.date.issued | 2025 | |
dc.description.abstract | Дипломна робота: 85 с., 29 рис., 10 табл., 44 посилань, 1 додаток. Об’єктом дослідження є емоційний контекст зображень, що входять до складу анотованого датасету. Предметом дослідження є глибокі нейронні мережі, мультимодальні моделі, застосовані до задачі класифікації емоційного контексту в зображеннях. Метою роботи є порівняння підходів та визначення найоптимальнішого підходу до автоматичного визначення емоцій в зображеннях на основі візуальних, семантичних і мультимодальних ознак. В результаті виконання роботи реалізовано та протестовано три архітектурні рішення – EfficientNet-B0 (візуальний підхід), CLIP ViT-B/32 (семантичний підхід), та мультимодальну ансамблеву модель (CLIP_BLIP + CNN + DeiT). Найвищі показники продемонструвала мультимодальна ансамблева модель. Новизна полягає у практичному поєднанні візуальних, текстових і семантичних ознак для емоційної класифікації зображень без використання явних текстових підказок. Рекомендації щодо використання – цей підхід може знайти застосування в системах аналізу емоційного впливу рекламних матеріалів, зокрема для оптимізації візуального контенту відповідно до цільової емоційної реакції. Також можливе використання в суміжних сферах – UXдослідженнях, медіааналітиці. | |
dc.description.abstractother | Thesis: 85 p., 29 figures, 10 tables, 44 references, appendix. The object of the study is the emotional context of visual content. The subject of the study is deep neural networks applied to the task of classifying the emotional context in images. The purpose of the work is to compare approaches and determine the most optimal solution for automatic recognition of emotions in images based on visual, semantic, and multimodal features. As a result of the work, three architectural solutions were implemented and tested – EfficientNet-B0 (visual approach), CLIP ViT-B/32 (semantic approach), and a multimodal ensemble model (CLIP_BLIP + CNN + DeiT). The highest performance was demonstrated by the multimodal ensemble model. The novelty lies in the practical combination of visual, textual, and semantic features for emotion classification in images without the use of explicit textual prompts. Recommendations for use – this approach can be applied in systems for analyzing the emotional impact of advertising materials, particularly for optimizing visual content according to the target emotional response. It can also be used in related fields – UX research, media analytics. | |
dc.format.extent | 102 с. | |
dc.identifier.citation | Яхненко, В. Ю. Аналіз емоційного контексту зображень із використанням сучасних архітектур глибокого навчання : дипломна робота … бакалавра : 122 Комп'ютерні науки / Яхненко Владислава Юріївна. – Київ, 2025. – 102 с. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/75892 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | аналіз емоцій | |
dc.subject | blip | |
dc.subject | clip | |
dc.subject | глибоке навчання | |
dc.subject | зображення | |
dc.subject | класифікація | |
dc.subject | мультимодальність | |
dc.title | Аналіз емоційного контексту зображень із використанням сучасних архітектур глибокого навчання | |
dc.type | Bachelor Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Yakhnenko_bakalavr.pdf
- Розмір:
- 13.7 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: