Передбачення наступного кадру у відео-потоці
Вантажиться...
Дата
2025
Автори
Подобєд, Дмитро Віталійович
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Дипломна робота: 100 с., 28 рис., 8 табл., 49 посилань, додаток.
Об’єкт дослідження – модель машинного навчання для передбачення наступного кадру у відеопотоці. Предмет дослідження – архітектури та методи прогнозування відео на основі нейронних мереж для моделювання просторово-часової динаміки. Мета роботи – дослідити існуючи рішення, розробити власну реалізацію. Прогнозування відео є фундаментальною задачею в комп'ютерному зорі, що має застосування у навчанні з підкріпленням, автономному водінні та стисненні даних. Висока розмірність та стохастичність відеопотоків створюють значні технічні виклики. Для їх вирішення було розроблено архітектуру, що складається з трьох етапів. На першому етапі автокодувальник зі скінченним скалярним квантуванням (FSQ) стискає кадри у компактні латентні представлення. На другому етапі рекурентна нейронна мережа (GRU) моделює часову динаміку цих представлень. Третій етап — додаткове навчання декодера з пропускними з’єднаннями від енкодера, що дозволяє поєднувати прогнозовану динаміку з статичною інформацією з попереднього кадру. За результатами експериментів, запропонований підхід продемонстрував високу ефективність. Донавчання декодера з пропускними з’єднаннями кардинально покращило якість генерованих кадрів, при цьому не значно збільшивши кількість параметрів моделі, що підтверджує практичну цінність розробленої архітектури.
Опис
Ключові слова
прогнозування відео, нейронні мережі, автокодувальник, рекурентні нейронні мережі, комп'ютерний зір, video prediction, neural networks, autoencoder, recurrent neural networks, computer vision
Бібліографічний опис
Подобєд, Д. В. Передбачення наступного кадру у відео-потоці : дипломна робота … бакалавра : 122 Комп'ютерні науки / Подобєд Дмитро Віталійович. – Київ, 2025. – 100 с.