Алгоритмічне забезпечення для розмітки надвеликих об’ємів даних для задачі детекції об’єктів методами комп’ютерного зору
Вантажиться...
Дата
2021-05
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Магістерська дисертація: 119 с., 33 рис., 6 табл., 2 додатки, 91 джерело.
Актуальність теми.Штучний інтелект все більше проникає у життя пересічних
людей, автоматизуючи такі звичнісфери життя, як керування автомобілем, покупки в
магазинах, діагностику захворювань та багато іншого. Для пришвидшення адаптації
алгоритмів штучного інтелекту в програмне забезпечення були створені програмні
платформи штучного інтелекту, такі як Microsoft Azure AI Platform, Amazon AWS
SageMaker, Google Cloud AI Platform, IBM Watson, які спрощують процес створення та
використання алгоритмів штучного інтелекту при вирішенні різноманітних прикладних
задач. Головним недоліком даних платформ являється те, що вони концентруються лише
на процесі створення та використання алгоритмів штучного інтелекту, хоча дослідження
в даній сфері показують, що 80% часу на таких проектах витрачається на роботу з
даними, зокрема на їх розмітку. В існуючих платформах підтримки задач штучного
інтелекту автоматизація процесу розмітки даних або відсутня, або наявна лише для
типових задач, що призводить до неефективного (повільного) процесу розмітки даних,
а отже збільшує вартість розробки програмного забезпечення з використанням
алгоритмів штучного інтелекту. Саме тому актуальною є задача розробки програмного
забезпечення розмітки даних, що дозволить пришвидшити розмітку надвеликих об’ємів
даних.
Мета досліджень.Підвищити ефективність, зокрема швидкодію, розмітки даних
для задач детекції об’єктів шляхом авторозмітки даних за допомогою методів
комп’ютерного зору, які виконують чорнову розмітку даних, на якій людині потрібно
лише виправити помилки, допущені алгоритмом в процесі авторозмітки. Щоб досягнути
поставленої мети необхідно організувати процес постійного донавчання алгоритму
детекції об’єктів на нових даних та вірний порядок розмітки зображень, що дозволить
пришвидшити розмітку усьогонаявного набору даних.
Для реалізації поставленої мети були сформовані наступні завдання:
-дослідити наявні підходи до автоматизації розмітки даних в програмних
платформах для вирішення задач штучного інтелекту;
-дослідити наявні підходи донавчання алгоритмів машинного навчання;
- удосконалити процес авторозмітки даних для задач детекції об’єктів з
метою пришвидшення розмітки надвеликих наборів даних;
-розробити програмне забезпеченняавторозмітки даних для задач детекції
об’єктів;
-виконати експериментальне дослідження характеристик розробленого
програмного забезпечення.
Об’єкт досліджень. Процес авторозмітки даних для задач комп’ютерного зору,
зокрема задач детекції об’єктів.
Предмет досліджень.Підходи до авторозмітки данихдля задач детекції об’єктів.
Методи досліджень. Емпіричні дослідження.
Наукова новизна. Запропоновано механізм пріоритезації процесу розмітки даних
як удосконалення механізму само-діагностики моделей детекції об’єктів, який
встановлює порядок розмітки даних шляхом першочергового відборудля навчання
алгоритму детекції об’єктів найскладніших зображень, вибір яких здійснюється на
основі агрегатів ознак, згенерованих глибокою згортковою нейромережею для оцінки
складності зображень, що пришвидшує процес навчання в порівнянні з використанням
випадкових зображень з того ж набору даних.
Удосконалено алгоритм авторозмітки надвеликих об’ємів даних длязадач детекції
об'єктів за рахунок використання запропонованого механізму пріоритезації
послідовності розмітки даних та адаптації підходів постійного донавчання алгоритмів
детекції, що дозволяє збільшити швидкість розмітки даних та використати даний
алгоритм для реалізації розміткинадвеликих даних для задач детекції як типових, так і
нетипових об’єктів.
Практичне значення. Розроблено програмне забезпечення авторозмітки даних в
рамках програмної платформи підтримки вирішення задач штучного інтелекту для задач
детекції об’єктів, що вирізняється від існуючих аналогів підвищеною швидкістю
процесу розмітки на надвеликих об’ємах.
Апробація. Основні положення роботи доповідались і обговорювались на IV
Міжнародній конференція з комп’ютерних наук, інжинірингу та освітніх технологій
(ICCSEEA 2021), а також на VІ Всеукраїнській науково-практичній конференції
молодих вчених та студентів «Інформаційні системи та технологіїуправління» (ІСТУ-2021).
Опис
Ключові слова
AI sofware platforms, computer vision, програмні платформи ШІ, комп’ютерний зір, нейронні мережі, детеція об’єктів, авторозмітка даних, надвеликі дані, neural networks, object detection, autolabeling, big data
Бібліографічний опис
Зарічковий, О. А. Алгоритмічне забезпечення для розмітки надвеликих об’ємів даних для задачі детекції об’єктів методами комп’ютерного зору : магістерська дис. : 121 Інженерія програмного забезпечення / Зарічковий Олександр Анатолійович. - Київ, 2021. - 119 с.