Сервіс з редагування зображення за текстовим описом

dc.contributor.advisorЖданова, Олена Григорівна
dc.contributor.authorКравчук, Олена Олександрівна
dc.date.accessioned2023-07-10T09:34:55Z
dc.date.available2023-07-10T09:34:55Z
dc.date.issued2022-12
dc.description.abstractАктуальність. Задача генерації реалістичних зображень за останні кілька років набула популярності. З подальшим розвитком генеративно-змагальних мереж на основі стилів, виникає питання, чи можливо здійснювати редагування реального зображення, використовуючи результати генеративних моделей. Щоб мінімізувати втручання суб’єкта в процес редагування, напрямок у редагуванні зображення пропонується визначати за текстовим запитом. Процес редагування такого типу вимагає якісної людської оцінки та великої кількості даних для здійснення окремої маніпуляції, тому дане завдання залишається актуальним дотепер. Мета дослідження – спрощення процесу редагування зображень за рахунок використання текстової інструкції користувача. Для досягнення мети необхідно виконати наступні завдання: виконати огляд існуючих методів редагування зображення за текстовим запитом; сформулювати математичну постановку задачі; здійснити порівняльний аналіз методів та моделей, які використовуються при побудові нейронної мережі; реалізувати метод оптимізації латентного простору; реалізувати метод прихованого мапера; розробити сервіс з редагування зображення за текстовим описом; провести експерименти для дослідження методів; виконати аналіз отриманих результатів. Об’єкт дослідження – процес редагування зображенням за текстовим запитом. Предмет дослідження – методи редагування зображення за текстовим запитом з використанням натренованої генеративно-змагальної мережі (StyleGAN) та моделі CLIP. Методи дослідження, застосовані у даній роботі, базуються на методах машинного навчання. Публікації. У процесі написання статті на тему «Порівняльний аналіз методів редагування зображення за текстовим описом».uk
dc.description.abstractotherRelevance. The task of generating realistic images has gained popularity over the past few years. With the further development of a possible generative-competitive network based on styles, questions arise: whether we can use the results of generative models for editing real images. In order to minimize the involvement of the individual in the editing process, the direction in image editing is proposed to be determined by a text request. The editing process of this type requires high-quality human evaluation and a large amount of data for individual manipulation, so this task remains relevant to this day. The purpose of the research is to simplify the image editing process by using a text user instructions. To achieve the goal, it is necessary to complete the following tasks: to perform an overview of existing methods of image editing by text request; to perform a comparative analysis of the methods and models used in the construction of a neural network; to formalize the mathematical formulation of the problem; to implement a method of latent optimization; to implement a method of latent mapper; to implement a service for editing images by text description; to conduct experiments to research methods; to analyze the obtained results. The object of the study - the process of image editing by text request. The subject of the research - image editing methods based on a text request using a trained generative adversarial network (StyleGAN) and the CLIP model. The research methods used in this work are based on machine learning methods. Publications. In the process of writing an article on the topic "Comparative analysis of image editing methods by text description".uk
dc.format.extent136 с.uk
dc.identifier.citationКравчук, О. О. Сервіс з редагування зображення за текстовим описом : магістерська дис. : 126 Інормаційні системи та технології / Кравчук Олена Олександрівна. – Київ, 2022. – 136 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/57929
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectмашинне навчанняuk
dc.subjectгенеративно-змагальні мережіuk
dc.subjectкерована текстом маніпуляція зображенняuk
dc.subjectприхований маперuk
dc.subjectпрограмний застосунокuk
dc.subject.udc004.91uk
dc.titleСервіс з редагування зображення за текстовим описомuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Kravchuk_magistr.pdf
Розмір:
2.06 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: