Інтерактивна багатоваріантна колоризація зображень на базі гібридної архітектури U-Net та B-Mamba

dc.contributor.advisorЖелезняков, Дмитро Валентинович
dc.contributor.authorКлиментьєв, Максим Андрійович
dc.date.accessioned2026-06-10T09:36:48Z
dc.date.available2026-06-10T09:36:48Z
dc.date.issued2026
dc.description.abstractКваліфікаційна робота містить: 74 стор., 15 рисунків, 5 таблиць, 36 джерел. Мета роботи – розробка обчислювально ефективної системи інтерактивної багатоваріантної колоризації. Об’єкт дослідження – процес керованого відновлення кольору на монохромних зображеннях. Предмет дослідження – гібридні генеративні нейромережеві моделі на базі згорток та селективних моделей простору станів. Спроєктовано та реалізовано гібридну архітектуру B-Mamba, що поєднує точність локального вилучення ознак U-Net із глобальним рецептивним полем двонаправленої Mamba. Для багатоваріантності розроблено алгоритм стохастичної генерації підказок на основі градієнтної значущості. Впровадження спільних ваг дозволило мінімізувати апаратні вимоги. Створено вебзастосунок для керування колоризацією у реальному часі. Експериментальний аналіз показав, що модель перевершує базові моделі, досягнувши FID 3.078 та LPIPS 0.143. Забезпечено низьке значення похибки дотримання підказок (MSEHINT = 6.1 × 10−5) при інференсі 15.08 мс та споживанні 187 МБ відеопам’яті. Користувацьке дослідження підтвердило високу реалістичність генерації та точність просторового керування кольором.
dc.description.abstractotherThe qualification work contains: 74 pages, 15 figures, 5 tables, 36 references. The purpose of the work is to develop a computationally efficient system for interactive multi-variant image colorization. The object of research is the process of controlled color restoration in monochrome images. The subject of research is hybrid generative neural network models based on convolutions and selective state space models. A hybrid architecture, B-Mamba, was designed and implemented, combining the precision of U-Net local feature extraction with the global receptive field of bidirectional Mamba. For multi-variant colorization, an algorithm for stochastic hint generation based on gradient saliency was developed. The introduction of shared weights minimized hardware requirements. A web application was created for realtime colorization control. Experimental analysis showed that the model outperforms baseline models, achieving an FID of 3.078 and LPIPS of 0.143. A low value of hint-following error was achieved (MSEHINT = 6.1 × 10−5 ) with a 15.08 ms inference time and 187 MB of video memory consumption. A user study confirmed the high visual realism of the generation and the accuracy of spatial color control.
dc.format.extent74 с.
dc.identifier.citationКлиментьєв, М. А. Інтерактивна багатоваріантна колоризація зображень на базі гібридної архітектури U-Net та B-Mamba : дипломна робота ... бакалавра : 113 Прикладна математика / Климентьєв Максим Андрійович. – Київ, 2026. – 74 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/81593
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectколоризація зображень
dc.subjectглибоке навчання
dc.subjectu-net
dc.subjectmamba
dc.subjectселективні моделі простору станів
dc.subjectінтерактивна колоризація
dc.subjectбагатоваріантна колоризація
dc.subject.udc004.93:004.8
dc.titleІнтерактивна багатоваріантна колоризація зображень на базі гібридної архітектури U-Net та B-Mamba
dc.typeBachelor Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Klymentiev_bakalavr.pdf
Розмір:
4.83 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: