An Infinitely Scalable Dataset of Single-Polygon Grayscale Images as a Fast Test Platform for Semantic Image Segmentation

dc.contributor.authorRomanuke, V. V.
dc.date.accessioned2021-03-02T15:08:55Z
dc.date.available2021-03-02T15:08:55Z
dc.date.issued2019
dc.description.abstractenBackground. Every new semantic image segmentation task requires fine-tuning the segmentation network architecture that is very hard to perform on images of high resolution, which may contain many categories and involve huge computational resources. So, the question is whether it is possible to test segmentation network architectures much faster in order to find optimal solutions that could be imparted to real-world semantic image segmentation tasks. Objective. The goal of the article is to design an infinitely scalable dataset, which could serve as a test platform for semantic image segmentation. The dataset will contain any number of entries of any size required for testing. Methods. A new artificial dataset is designed for semantic image segmentation. The dataset is of grayscale images with the white background. A polygonal object is randomly placed on the background. The polygon edges are black, whereas the polygon body is transparent. Thus, a dataset image is a set of edges of a convex polygon on the white background. The polygon edge is one pixel thick but the transition between the white background and the polygon black edges includes gray pixels in the vicinity of one-pixel edges. Such a noise is an aftermath of the image file format conversion process. The number of edges of the polygon is randomly generated for every next image. The polygon size and position of its center of mass with respect to image margins are randomized as well. Results. A toy dataset of any volume and image size from scratch can be generated. Besides, the dataset generator automatically labels pixels to classes “background” and “polygon”. The dataset does not need augmentation. Eventually, the dataset is infinitely scalable, and it will serve as a fast test platform for segmentation network architectures. Conclusions. The considered examples of using the polygonal dataset confirm its appropriateness and capability of networks trained on it to successfully segment stacks of objects. Additionally, a criterion of early stopping is revealed based on empty image segmentation.uk
dc.description.abstractruПроблематика. Каждая новая задача семантической сегментации изображений требует тонкой настройки архитектуры сети сегментации, которую очень трудно выполнить на изображениях высокого разрешения, которые могут содержать много категорий и вовлекать огромные вычислительные ресурсы. Таким образом, вопрос заключается в том, можно ли гораздо быстрее протестировать архитектуры сетей сегментации, чтобы найти оптимальные решения, которые могли бы быть применены к реальным задачам семантической сегментации изображений. Цель исследования. Статья посвящена разработке бесконечно масштабируемого набора данных, который мог бы служить тестовой платформой для семантической сегментации изображений. Набор данных будет содержать любое количество записей любого размера, необходимого для тестирования. Методика реализации. Новый искусственный набор данных проектируется для семантической сегментации изображений. Этот набор данных представляет собой изображения в градациях серого с белым фоном. Многоугольный объект случайным образом размещается на фоне. Ребра многоугольника – черные, а тело многоугольника – прозрачное. Таким образом, изображение набора данных представляет собой набор ребер выпуклого многоугольника на белом фоне. Край многоугольника имеет толщину в один пиксель, но переход между белым фоном и черными краями многоугольника включает серые пиксели в окрестности однопиксельных краев. Такой шум является последствием процесса преобразования формата файла изображения. Количество ребер многоугольника генерируется случайным образом для каждого следующего изображения. Размер многоугольника и положение его центра масс относительно полей изображения также рандомизированы. Результаты исследования. Модельный набор данных любого объема и размера изображения может быть сгенерирован “с нуля”. Кроме того, генератор наборов данных автоматически категоризирует пиксели для классов “background” и “polygon”. Такой набор данных не нуждается в приращении. В конце концов, этот набор данных можно бесконечно масштабировать, и он будет служить платформой быстрого тестирования для архитектур сетей сегментации. Выводы. Рассмотренные примеры использования набора данных из многоугольников подтверждают его пригодность и способность обученных сетей успешно сегментировать комплекты объектов. Кроме того, обнаруживается критерий ранней остановки на основе сегментации пустого изображения.uk
dc.description.abstractukПроблематика. Кожна нова задача семантичної сегментації зображень вимагає тонкої настройки архітектури мережі сегментації, яку дуже важко виконати на зображеннях високої роздільної здатності, що можуть містити багато категорій і залучати величезні обчислювальні ресурси. Таким чином, питання полягає в тому, чи можна набагато швидше протестувати архітектури мереж сегментації, щоб знайти оптимальні рішення, які могли б бути застосовані до реальних завдань семантичної сегментації зображень. Мета дослідження. Стаття присвячена розробці набору даних із нескінченним масштабуванням, який міг би слугувати тестовою платформою для семантичної сегментації зображень. Набір даних буде містити будь-яку кількість записів будь-якого розміру, необхідного для тестування. Методика реалізації. Новий штучний набір даних проектується для семантичної сегментації зображень. Цей набір даних являє собою зображення в градаціях сірого з білим тлом. Багатокутний об’єкт випадковим чином розміщується на тлі. Ребра багатокутника – чорні, а тіло багатокутника – прозоре. Таким чином, зображення набору даних являє собою набір ребер опуклого багатокутника на білому тлі. Край багатокутника має товщину в один піксель, але перехід між білим тлом і чорними краями багатокутника включає сірі пікселі в околиці однопіксельних країв. Такий шум є наслідком процесу перетворення формату файлу зображення. Кількість ребер багатокутника генерується випадковим чином для кожного наступного зображення. Розмір багатокутника і положення його центра мас щодо полів зображення також рандомізовані. Результати дослідження. Модельний набір даних будь-якого обсягу і розміру зображення може бути згенерований “з нуля”. Крім того, генератор наборів даних автоматично категоризує пікселі для класів “background” і “polygon”. Такий набір даних не потребує збільшення. Зрештою, цей набір даних можна нескінченно масштабувати, і він буде слугувати платформою швидкого тестування для архітектур мереж сегментації. Висновки. Розглянуті приклади використання набору даних із багатокутників підтверджують його придатність і здатність навчених мереж успішно сегментувати комплекти об’єктів. Крім того, виявляється критерій ранньої зупинки на основі сегментації порожнього зображення.uk
dc.format.pagerangePp. 24-34uk
dc.identifier.citationRomanuke, V. V. An Infinitely Scalable Dataset of Single-Polygon Grayscale Images as a Fast Test Platform for Semantic Image Segmentation / V. V. Romanuke // Наукові вісті КПІ : міжнародний науково-технічний журнал. – 2019. – № 1(123). – С. 24–34. – Бібліогр.: 17 назв.uk
dc.identifier.doihttps://doi.org/10.20535/kpi-sn.2019.1.157259
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/39747
dc.language.isoenuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/uk
dc.sourceНаукові вісті КПІ : міжнародний науково-технічний журнал, 2019, № 1(123)uk
dc.subjectsemantic image segmentationuk
dc.subjectdatasetuk
dc.subjectpolygonal objectuk
dc.subjecttransparent backgrounduk
dc.subjectaugmentationuk
dc.subjectsegmentation network architectureuk
dc.subjectempty image segmentationuk
dc.subjectсемантична сегментація зображеньuk
dc.subjectнабір данихuk
dc.subjectбагатокутний об’єктuk
dc.subjectпрозоре тлоuk
dc.subjectзбільшенняuk
dc.subjectархітектура мережі сегментаціїuk
dc.subjectсегментація порожнього зображенняuk
dc.subjectсемантическая сегментация изображенийuk
dc.subjectнабор данныхuk
dc.subjectмногоугольный объектuk
dc.subjectпрозрачный фонuk
dc.subjectприращениеuk
dc.subjectархитектура сети сегментацииuk
dc.subjectсегментация пустого изображенияuk
dc.subject.udc004.622:004.021uk
dc.titleAn Infinitely Scalable Dataset of Single-Polygon Grayscale Images as a Fast Test Platform for Semantic Image Segmentationuk
dc.title.alternativeНабір даних нескінченного масштабування із зображень у градаціях сірого з одним багатокутником як швидка тестова платформа для семантичної сегментації зображеньuk
dc.title.alternativeБесконечно масштабируемый набор данных из изображений в градациях серого с одним многоугольником как быстрая тестовая платформа для семантической сегментации изображенийuk
dc.typeArticleuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
NVKPI2019-1_03.pdf
Розмір:
474.17 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.01 KB
Формат:
Item-specific license agreed upon to submission
Опис: