Сирота, Сергій ВікторовичСліпченко, Максим Сергійович2024-05-232024-05-232024Сліпченко, М. С. Математичне та програмне забезпечення системи розпізнавання зображень об’єктів у відеопотоці : магістерська дис. : 113 Прикладна математика / Сліпченко Максим Сергійович. – Київ, 2024. – 96 с.https://ela.kpi.ua/handle/123456789/66864Дисертацію виконано на 80 аркушах, вона містить 2 додатки та перелік посилань на використані джерела з 17 найменувань. У роботі наведено 32 рисунки та 4 таблиці. Актуальність теми. Сучасний світ переживає епоху стрімкого розвитку технологій, зокрема в області штучного інтелекту. Одна з класичних задач цієї області – розпізнавання тексту на зображенні. Експериментуючи з підходами для рішення, фахівці зрозуміли, що комп’ютери можна навчити бачити набагато складніші речі. Сьогодні нейронні мережі дозволяють розпізнавати та класифікувати об’єкти не тільки на зображеннях, але і в режимі відео, аналізуючи та використовуючи інформацію з попередніх кадрів. Зараз це має своє застосування в багатьох сферах: медицина, автономна навігація, безпека. Неможна ігнорувати і ще одне застосування, що є дуже актуальним зараз для України. Моделі комп’ютерного зору зараз активно використовуються у воєнній сфері: як допоміжна функціональність під час повітряної розвідки, як допомога при наведенні або для виявлення цілі. Враховуючи великий об’єм даних, що потребується для створення якісної моделі розпізнавання об’єктів, задача створення програмного забезпечення для розпізнавання та автоматизації створення навчальних даних є актуальною. Зв’язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконувалась згідно з планом науково-дослідних робіт кафедри прикладної математики Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського». Мета і задачі дослідження. Метою дослідження є створення програмного забезпечення для розпізнавання зображень об’єктів на відео, зокрема на прикладі транспортних засобів, та реалізація технологічного процесу автоматизованого навчання моделі комп’ютерного зору. Для досягнення мети дослідження було розв’язано такі задачі: – провести огляд предметної області – представлення зображень та відео в комп’ютерних системах, опис базових відомостей про нейронні мережі; – здійснити аналіз та оцінку існуючих алгоритмів комп’ютерного зору; – сформувати навчальні дані та розробити програмне забезпечення системи розпізнавання зображень об’єктів; – обчислити метрики ефективності розробленого програмного забезпечення; – розробити технологічний процес автоматизації створення навчальних даних та оцінити ефективність використання автоматизації для розробки моделей комп’ютерного зору. Об’єктом дослідження є алгоритми та моделі для задач комп’ютерного зору, автоматизація процесів машинного навчання. Предметом дослідження є застосування згорткових нейронних мереж для розпізнавання та класифікації об’єктів на зображеннях та відео. Методи дослідження. Для розв’язання поставленої задачі використовувалися такі методи: методи кодування та декодування файлів зображень та відеофайлів (для коректного опрацювання вхідних даних), методи глибокого навчання для задач комп’ютерного зору, методи теорії алгоритмів та програмування (для розробки програмного забезпечення системи розпізнавання зображень об’єктів на відео потоці), методи автоматизації програмного забезпечення (для побудови технологічного процесу автоматизації створення навчальних даних). Наукова новизна одержаних результатів складається з таких положень: – удосконалено методи асоціації об’єктів між кадрами, які, на відміну від існуючих, реалізовані шляхом поєднання алгоритму розпізнавання YOLO та алгоритму групування SORT, що дає змогу ефективно виконувати поставлену задачу в режимі реального часу; – розроблено універсальний алгоритм автоматизації створення навчальної розмітки для моделей комп’ютерного зору, що дає можливість створювати подібні системи розпізнавання значно швидше. Практичне значення одержаних результатів. Розроблене програмне забезпечення можна використовувати для розпізнавання обʼєктів засобів транспорту на відеопотоці. Також розробка дозволяє суттєво пришвидшити навчання моделей комп’ютерного зору за умови, якщо навчальні дані ще не підготовлені. Також це дає простір для подальшої автоматизації, бо запропонованим підходом можна створювати навчальні датасети для різних моделей машинного навчання. Розробку можна використовувати напряму для створення моделі-тренера, яка буде надавати розмітку даних з необхідними класами для моделей комп’ютерного зору різного призначення. Апробація результатів дисертації. Основні положення й результати роботи представлено на Науковій конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг ПМК 2023». Публікації. Результати дисертації викладено в 1 науковій праці: – у 1 публікації у тезах конференцій.96 с.ukнейронна мережамодель комп’ютерного зоруавтоматизаціянавчаннярозміткаМатематичне та програмне забезпечення системи розпізнавання зображень об’єктів у відеопотоціMaster Thesis004.896