Оптимізація латентного простору варіаційних автоенкодерів з використанням навчання з підкріпленням
Вантажиться...
Дата
2026
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Робота присвячена проблемі областей низької щільності (порожнин) у латентному просторі варіаційних автоенкодерів (VAE). Запропоновано метод спільного навчання VAE та агента навчання з підкріпленням на основі алгоритму Proximal Policy Optimisation (PPO), який динамічно зміщує апріорний розподіл під час навчання. Агент спостерігає статистику латентного простору та керується багатокомпонентним сигналом винагороди, що балансує покриття, рівномірність, якість реконструкції та регуляризацію. Експерименти на MNIST, Fashion-MNIST та EMNIST демонструють покращення Fréchet Inception Distance на 1,9--2,6% у режимі помірного колапсу апостеріорного розподілу, а також найкраще покриття міноритарних класів на незбалансованих наборах даних порівняно з базовими методами.
Опис
Ключові слова
навчання з підкріпленням, варіаційний автоенкодер, латентний простір, proximal policy optimisation, апріорний розподіл, метрика покриття
Бібліографічний опис
Харь, Д. Ф. Оптимізація латентного простору варіаційних автоенкодерів з використанням навчання з підкріпленням / Д. Ф. Харь, Н. М. Куссуль // Теоретичні і прикладні проблеми фізики, математики та інформатики : матеріали XXIV Всеукраїнської науково-практичної конференції студентів, аспірантів та молодих вчених, [Київ], 13–16 травня 2026 р. / КПІ ім. Ігоря Сікорського. – Київ, 2026. – С. 370-373.