Способи розпізнавання об’єктів на зображеннях
Вантажиться...
Дата
2023
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Актуальність теми. Розвиток комп’ютерного зору на сьогоднішній день є дуже швидким. Він дозволяє автоматизувати велику кількість процесів у багатьох сферах. Розпізнавання об’єктів є однією з основних задач комп’ютерного зору та використовується в різних сферах, а саме робототехніка та медицина. Автоматизація будь-якого процесу передбачає використання електронних пристроїв. На сьогоднішній день існує велика кількість розроблених нейронних мереж, що мають свої переваги та недоліки. Україна є країною, що розвивається і фірми-виробники зацікавлені в тому, щоб інвестувати свої кошти в нашу державу. З огляду на те, що автоматизація процесів завжди є актуальною, розробка методів розпізнавання об’єктів на практиці є актуальною і важливою задачею, як з наукової, так і з практичної точки зору.
Об’єктом дослідження є способи розпізнавання об’єктів на зображенні, вивчення та аналіз основних понять нейронної мережі.
Предметом дослідження є існуючі способи розпізнавання об’єктів за допомогою нейронних мереж.
Мета роботи: покращення способу розпізнавання об’єктів за рахунок модифікації методу який використовує згорткові нейронні мережі.
Наукова новизна полягає в наступному:
1. Запропоновано метод розпізнавання зображень, який має бути точніше на кілька відсотків при розпізнаванні об’єктів.
2. Досліджено переваги та недоліки запропонованого методу на практиці.
Практична цінність отриманих в роботі результатів полягає в тому, що запропоновані способи дають змогу підвищити показники нейронної мережі без додавання зображень в існуючу базу даних, на основі якої мережа проходить тренування. Запропонований метод використовує аугментації існуючих зображень і який заснований на нейронній мережі YOLOv5, що дає змогу нейронній мережі обробити більше вхідних даних, без потреби у розширенні існуючого набору зображень.
Апробація роботи. Основні положення та результати роботи були представлення та обговорювались на XVІ науково-практичній конференції магістрантів та аспірантів ПМК-2023 (Київ, 28-30 листопада 2023 р.) та X Міжнародна науково-технічна Internet-конференція «Сучасні методи, інформаційне, програмне та технічне забезпечення систем керування організаційно-технічними та технологічними комплексами» (24 листопада 2023 р.)
Структура та обсяг роботи. Магістерська дисертація складається з вступу, чотирьох розділів та висновків.
У вступі подано загальну характеристику роботи, зроблено оцінку сучасного стану проблеми, обґрунтовано актуальність напрямку досліджень, практичну цінність роботи.
У першому розділі розглянуто теоретичну складову комп’ютерного зору та нейронних мереж, проведено аналіз функцій нейронних мереж, що дає змогу визначити основні переваги та недоліки даних функцій
У другому розділі розглянуто інформацію про глибинні нейронні мережі, описано види нейронних мереж. Визначено тип глибинної нейронної мережі, що буде використовуватись у дослідженні, проаналізовано її основні елементи.
У третьому розділі описано обраний програмний засіб, та специфіка модифікованого методу розпізнавання об’єктів
У четвертому розділі надано результати роботи запропонованого методу та порівняно отримані результати з базовим методом розпізнавання зображень
У висновках представлені результати проведеної роботи.
Робота представлена на 82 аркушах, містить посилання на список використаних літературних джерел.
Опис
Ключові слова
комп’ютерний зір, розпізнавання об’єктів, нейронна мережа, computer vision, object recognition, neural network.
Бібліографічний опис
Кучер, І. І. Способи розпізнавання об’єктів на зображеннях : магістерська дис. : 123 Комп'ютерна інженерія / Кучер Іван Іванович. – Київ, 2023. – 87 с.