Системи генерації візуального контенту

Вантажиться...
Ескіз

Дата

2022

Автори

Ситнік, Софія Олегівна

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

В ході бакалаврської роботи було реалізовано інтерфейс для генерації на основі двох архітектур нейронних мереж, які наразі є найбільш сучасними. Та засновані на двох принципово різних підходах до цієї задачі, а саме VQGAN та Denoising Diffusion. Детально описаний спосіб та можливості налаштувань генерації зображень через реалізований веб-інтерфейс. Продемонстровані фрагменти коду застосування CLIP моделі для скерування генерації в напрямку подібності до текствого опису. Продемонстровані результати генерації зображень моделей VQGAN та Guided Diffusion на різні та однакові для обох моделей текстові запити.

Опис

Ключові слова

штучний інтелект, artificial intelligence, дифузійні моделі, diffusion models, генерація зображень, image generation, нейронні мережі, neural networks, машинне навчання, machine learning, моделі трансформер, transformer models

Бібліографічний опис

Ситнік, С. О. Системи генерації візуального контенту : дипломний проект … бакалавра : 121 Інженерія програмного забезпечення / Ситнік Софія Олегівна. – Київ, 2022. – 85 с.

ORCID

DOI