Агент штучного інтелекту для пошуку абстрактної та креативної відповідності між зображенням та текстом

dc.contributor.advisorШаповал, Наталія Віталіївна
dc.contributor.authorЄфанов, Ілля Сергійович
dc.date.accessioned2024-10-03T08:10:57Z
dc.date.available2024-10-03T08:10:57Z
dc.date.issued2024
dc.description.abstractДипломна робота: 107 с., 23 рис., 6 табл., 21 посилань, 1 додаток. Об’єкт дослідження – опис зображення. Предмет дослідження – методи створення креативних та абстрактних описів зображення. Мета роботи – дослідження та застосування методів глибокого навчання, а саме – генеративних моделей, які дозволять створити креативні та абстрактні описи зображень. Актуальність генерації креативних описів полягає в розширенні можливостей image-captioning, який автоматично створює текстові описи зображень. Це корисно для допомоги людям з обмеженими можливостями, пошукових систем і контент-маркетингу. Стандартні моделі генерують короткі описи, але створення креативних текстів з урахуванням асоціацій, деталей та емоцій відкриває нові перспективи, підвищуючи значення асоціативно-емоційного відгуку. Роботу було апробовано на конференції «Штучний інтелект: досягнення, виклики та ризики» та запланована публікація статті в 2024 році. За результатами роботи отримано агент, здатний генерувати креативні підписи, отримаючи на вхід гральні карти Dixit.
dc.description.abstractotherBachelor Thesis: 107 pages, 23 figures, 9 tables, 21 references, 1 appendix. Object of research is image captioning. Subject of research is methods for creating creative and abstract image captioning. Objective is to research and apply deep learning methods, specifically generative models, to create creative and abstract image descriptions. The relevance of generating creative descriptions lies in enhancing the capabilities of image-captioning, which automatically creates textual descriptions of images. This is useful for aiding people with disabilities, search systems, and content marketing. Standard models generate short descriptions, but creating creative texts that consider associations, details, and emotions opens new perspectives, increasing the significance of associative-emotional feedback. The work was presented at the conference "Artificial Intelligence: Achievements, Challenges, and Risks" and is scheduled for publication in 2024. As a result, an agent capable of generating creative captions based on Dixit playing cards was developed.
dc.format.extent107 с.
dc.identifier.citationЄфанов, І. С. Агент штучного інтелекту для пошуку абстрактної та креативної відповідності між зображенням та текстом : дипломна робота ... бакалавра : 122 Комп'ютерні науки / Єфанов Ілля Сергійович. – Київ, 2024. – 107 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/69497
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectзображення
dc.subjectопис зображень
dc.subjectнейронна мережа
dc.subjectвелика мовна модель
dc.subjectмультимодальна велика мовна модель
dc.subjectкреативний опис зображень
dc.subjectгральні карти
dc.subjectабстрактний опис зображення
dc.subjectгенеративна модель
dc.subjectimages
dc.subjectimage descriptions
dc.subjectneural network
dc.subjectlarge language model
dc.subjectmultimodal large language model
dc.subjectcreative image description
dc.subjectplaying cards
dc.subjectabstract image description
dc.subjectgenerative model
dc.titleАгент штучного інтелекту для пошуку абстрактної та креативної відповідності між зображенням та текстом
dc.typeBachelor Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Efanov_bakalavr.pdf
Розмір:
2.29 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: