Сервіс з редагування зображення за текстовим описом
Вантажиться...
Дата
2022-12
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Актуальність. Задача генерації реалістичних зображень за останні кілька років набула популярності. З подальшим розвитком генеративно-змагальних мереж на основі стилів, виникає питання, чи можливо здійснювати редагування реального зображення, використовуючи результати генеративних моделей. Щоб мінімізувати втручання суб’єкта в процес редагування, напрямок у редагуванні зображення пропонується визначати за текстовим запитом. Процес редагування такого типу вимагає якісної людської оцінки та великої кількості даних для здійснення окремої маніпуляції, тому дане завдання залишається актуальним дотепер.
Мета дослідження – спрощення процесу редагування зображень за рахунок використання текстової інструкції користувача.
Для досягнення мети необхідно виконати наступні завдання:
виконати огляд існуючих методів редагування зображення за текстовим запитом;
сформулювати математичну постановку задачі;
здійснити порівняльний аналіз методів та моделей, які використовуються при побудові нейронної мережі;
реалізувати метод оптимізації латентного простору;
реалізувати метод прихованого мапера;
розробити сервіс з редагування зображення за текстовим описом;
провести експерименти для дослідження методів;
виконати аналіз отриманих результатів.
Об’єкт дослідження – процес редагування зображенням за текстовим запитом.
Предмет дослідження – методи редагування зображення за текстовим запитом з використанням натренованої генеративно-змагальної мережі (StyleGAN) та моделі CLIP.
Методи дослідження, застосовані у даній роботі, базуються на методах машинного навчання.
Публікації. У процесі написання статті на тему «Порівняльний аналіз методів редагування зображення за текстовим описом».
Опис
Ключові слова
машинне навчання, генеративно-змагальні мережі, керована текстом маніпуляція зображення, прихований мапер, програмний застосунок
Бібліографічний опис
Кравчук, О. О. Сервіс з редагування зображення за текстовим описом : магістерська дис. : 126 Інормаційні системи та технології / Кравчук Олена Олександрівна. – Київ, 2022. – 136 с.