Сервіс з редагування зображення за текстовим описом
dc.contributor.advisor | Жданова, Олена Григорівна | |
dc.contributor.author | Кравчук, Олена Олександрівна | |
dc.date.accessioned | 2023-07-10T09:34:55Z | |
dc.date.available | 2023-07-10T09:34:55Z | |
dc.date.issued | 2022-12 | |
dc.description.abstract | Актуальність. Задача генерації реалістичних зображень за останні кілька років набула популярності. З подальшим розвитком генеративно-змагальних мереж на основі стилів, виникає питання, чи можливо здійснювати редагування реального зображення, використовуючи результати генеративних моделей. Щоб мінімізувати втручання суб’єкта в процес редагування, напрямок у редагуванні зображення пропонується визначати за текстовим запитом. Процес редагування такого типу вимагає якісної людської оцінки та великої кількості даних для здійснення окремої маніпуляції, тому дане завдання залишається актуальним дотепер. Мета дослідження – спрощення процесу редагування зображень за рахунок використання текстової інструкції користувача. Для досягнення мети необхідно виконати наступні завдання: виконати огляд існуючих методів редагування зображення за текстовим запитом; сформулювати математичну постановку задачі; здійснити порівняльний аналіз методів та моделей, які використовуються при побудові нейронної мережі; реалізувати метод оптимізації латентного простору; реалізувати метод прихованого мапера; розробити сервіс з редагування зображення за текстовим описом; провести експерименти для дослідження методів; виконати аналіз отриманих результатів. Об’єкт дослідження – процес редагування зображенням за текстовим запитом. Предмет дослідження – методи редагування зображення за текстовим запитом з використанням натренованої генеративно-змагальної мережі (StyleGAN) та моделі CLIP. Методи дослідження, застосовані у даній роботі, базуються на методах машинного навчання. Публікації. У процесі написання статті на тему «Порівняльний аналіз методів редагування зображення за текстовим описом». | uk |
dc.description.abstractother | Relevance. The task of generating realistic images has gained popularity over the past few years. With the further development of a possible generative-competitive network based on styles, questions arise: whether we can use the results of generative models for editing real images. In order to minimize the involvement of the individual in the editing process, the direction in image editing is proposed to be determined by a text request. The editing process of this type requires high-quality human evaluation and a large amount of data for individual manipulation, so this task remains relevant to this day. The purpose of the research is to simplify the image editing process by using a text user instructions. To achieve the goal, it is necessary to complete the following tasks: to perform an overview of existing methods of image editing by text request; to perform a comparative analysis of the methods and models used in the construction of a neural network; to formalize the mathematical formulation of the problem; to implement a method of latent optimization; to implement a method of latent mapper; to implement a service for editing images by text description; to conduct experiments to research methods; to analyze the obtained results. The object of the study - the process of image editing by text request. The subject of the research - image editing methods based on a text request using a trained generative adversarial network (StyleGAN) and the CLIP model. The research methods used in this work are based on machine learning methods. Publications. In the process of writing an article on the topic "Comparative analysis of image editing methods by text description". | uk |
dc.format.extent | 136 с. | uk |
dc.identifier.citation | Кравчук, О. О. Сервіс з редагування зображення за текстовим описом : магістерська дис. : 126 Інормаційні системи та технології / Кравчук Олена Олександрівна. – Київ, 2022. – 136 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/57929 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | машинне навчання | uk |
dc.subject | генеративно-змагальні мережі | uk |
dc.subject | керована текстом маніпуляція зображення | uk |
dc.subject | прихований мапер | uk |
dc.subject | програмний застосунок | uk |
dc.subject.udc | 004.91 | uk |
dc.title | Сервіс з редагування зображення за текстовим описом | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Kravchuk_magistr.pdf
- Розмір:
- 2.06 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: