Агент штучного інтелекту для пошуку абстрактної та креативної відповідності між зображенням та текстом
Вантажиться...
Дата
2024
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Дипломна робота: 107 с., 23 рис., 6 табл., 21 посилань, 1 додаток.
Об’єкт дослідження – опис зображення.
Предмет дослідження – методи створення креативних та абстрактних
описів зображення.
Мета роботи – дослідження та застосування методів глибокого
навчання, а саме – генеративних моделей, які дозволять створити креативні
та абстрактні описи зображень.
Актуальність генерації креативних описів полягає в розширенні
можливостей image-captioning, який автоматично створює текстові описи
зображень. Це корисно для допомоги людям з обмеженими можливостями,
пошукових систем і контент-маркетингу. Стандартні моделі генерують
короткі описи, але створення креативних текстів з урахуванням асоціацій,
деталей та емоцій відкриває нові перспективи, підвищуючи значення
асоціативно-емоційного відгуку. Роботу було апробовано на конференції
«Штучний інтелект: досягнення, виклики та ризики» та запланована
публікація статті в 2024 році.
За результатами роботи отримано агент, здатний генерувати креативні
підписи, отримаючи на вхід гральні карти Dixit.
Опис
Ключові слова
зображення, опис зображень, нейронна мережа, велика мовна модель, мультимодальна велика мовна модель, креативний опис зображень, гральні карти, абстрактний опис зображення, генеративна модель, images, image descriptions, neural network, large language model, multimodal large language model, creative image description, playing cards, abstract image description, generative model
Бібліографічний опис
Єфанов, І. С. Агент штучного інтелекту для пошуку абстрактної та креативної відповідності між зображенням та текстом : дипломна робота ... бакалавра : 122 Комп'ютерні науки / Єфанов Ілля Сергійович. – Київ, 2024. – 107 с.