Методи визначення порогового значення зображення як спосіб покращення доповненої реальності

dc.contributor.authorБезпалько, Олександр Сергійович
dc.date.accessioned2021-04-06T20:58:49Z
dc.date.available2021-04-06T20:58:49Z
dc.date.issued2020
dc.description.abstractenBackground. Augmented reality technology is at the initial stage of its development and requires further development of new and improvement of existing methods and algorithms. The most common and reliable approach to the implementation of augmented reality is the marker approach. The definition of the marker is divided into several stages, one of the most important of which is to determine the threshold of the image. Properly chosen algorithm for determining this threshold can significantly increase the efficiency of the algorithm for finding the marker. Objective. The aim of the study is a comparative analysis of threshold algorithms based on the type of information used and evaluation of their effectiveness based on a set of objective indicators of segmentation quality. Comparison is made for images and documents. For an objective comparison of efficiency, we used a combination of 4 quality criteria for form segmentation. Methods. The following performance criteria were used to determine the performance of the threshold determination methods: classification error, boundary determination error, relative foreground error, and non-uniformity region. Two approaches were considered to obtain an average performance score according to the previous criteria. The first approach was the arithmetic averaging of normalized scores obtained by all criteria. Using a specific threshold algorithm for the image, the average value of all criteria was determined, which was an indicator of its segmentation quality. In turn, the sum of these quality indicators for all images was determined as the performance indicator of the algorithm. The second approach used rank averaging, so that for each test image there was a ranking of algorithms of the threshold value from 1 to 16 according to each criterion separately. Then the ranks (not the actual scores) were averaged both by images and by all criteria. Results. A general unified comparative analysis of the performance of 16 algorithms for determining the threshold value of the image was conducted, which makes it possible to improve the functioning of technologies that depend on determining the threshold of images, including the mechanism of augmented reality marker recognition. Conclusions. It has been observed that the clustering-based method, namely the Kittler method, and the entropy-based method, namely the Kapoor method, are the best algorithms for determining thresholds for specialized images. Similarly, the Kittler clustering method and the Sauwol and White local variable methods are the best working algorithms for binarization of text documents.uk
dc.description.abstractruПроблематика. Технология дополненной реальности находится на начальном этапе своего развития и требует разработок новых и совершенствования существующих методик и алгоритмов работы. Наиболее распространенным и надежным взглядом на реализацию дополненной реальности остается маркерный подход. Определение маркера делят на несколько этапов, среди которых одним из важнейших является определение порога изображения. Цель исследования. Сделать сравнительный анализ алгоритмов пороговых показателей по типу используемой информации и оценить их эффективность на основе набора объективных показателей качества сегментации. Методика реализации. Для оценки производительности использования методов определения пороговых значений были использованы следующие критерии эффективности: ошибка классификации, ошибка определения предела, относительная ошибка области переднего плана и регион неравномерности. Чтобы получить средний балл результативности по предварительным критериям, было использовано арифметическое усреднение нормированных баллов, полученных по всем критериям. Так, используя конкретный пороговый алгоритм для изображения, было определено среднее значение всех критериев, то есть показатель качества сегментации изображения. Так же сумму этих показателей качества для всех изображений определено как показатель производительности алгоритма. При втором подходе использовано усреднения рангов, так что для каждого тестового изображения происходило ранжирование алгоритмов порогового значения от 1-го до 16-ти в соответствии с каждым критерием в отдельности. Тогда ранги (а не фактические баллы) были усредненные как по изображениям, так и по всем критериям. Результаты исследования. Проведено общий унифицированный сравнительный анализ производительности работы 16-ти алгоритмов определения порогового значения изображения, что позволяет улучшить функционирование технологий, которые зависят от измерения порога изображений, в том числе и механизма распознавания меток дополненной реальности. Выводы. Доказано, что метод, основанный на кластеризации, а именно метод Киттлера, и метод основан на энтропии, а именно метод Капура, являются лучшими алгоритмами определения пороговых показателей специализированных изображений. Аналогично, метод, основанный на кластеризации Киттлера, и методы локальных переменных Саувола и Уайта являются лучшими действующими алгоритмами для бинаризации текстовых документов.uk
dc.description.abstractukПроблематика. Технологія доповненої реальності знаходиться на початковому етапі свого розвитку та потребує розроблення нових і вдосконалення наявних методик й алгоритмів роботи. Найбільш поширеним і надійним поглядом на реалізацію доповненої реальності залишається маркерний підхід. Визначення маркера поділяють на декілька етапів, серед яких одним із найважливіших є визначення порога зображення. Мета дослідження. Здійснити порівняльний аналіз алгоритмів порогових показників за типом використовуваної інформації й оцінити їх ефективність на основі набору об’єктивних показників якості сегментації. Методика реалізації. Для оцінки продуктивності застосування методів визначення порогових значень були використані такі критерії ефективності: помилка класифікації, помилка визначення межі, відносна помилка області переднього плану та регіон нерівномірності. Щоб отримати середній бал результативності за попередніми критеріями, було використано арифметичне усереднення нормованих балів, отриманих за всіма критеріями. Так, використовуючи конкретний пороговий алгоритм для зображення, ми визначили середнє значення всіх критеріїв, тобто показник якості сегментації зображення. Так само суму цих показників якості для всіх зображень визначено як показник продуктивності алгоритму. При другому підході застосовано усереднення рангів, тож для кожного тестового зображення відбувалось ранжування алгоритмів порогового значення від 1-го до 16-ти відповідно до кожного критерію окремо. Тоді ранги (а не фактичні бали) були усереднені як за зображеннями, так і за всіма критеріями. Результати дослідження. Проведено загальний уніфікований порівняльний аналіз продуктивності роботи 16-ти алгоритмів визначення порогового значення зображення, що дає змогу покращити функціонування технологій, які залежать від вимірювання порога зображень, зокрема й механізму розпізнавання маркера доповненої реальності. Висновки. З’ясовано, що метод, оснований на кластеризації, а саме метод Кіттлера, та метод, оснований на ентропії, а саме метод Капура, є найкращими алгоритмами визначення порогових показників спеціалізованих зображень. Аналогічно, метод, оснований на кластеризації, Кіттлера, та методи локальних змінних Саувола та Вайта є найкращими дієвими алгоритмами бінаризації текстових документів.uk
dc.format.pagerangeС. 18-25uk
dc.identifier.citationБезпалько, О. С. Методи визначення порогового значення зображення як спосіб покращення доповненої реальності / О. С. Безпалько // Наукові вісті КПІ : міжнародний науково-технічний журнал. – 2020. – № 4(131). – С. 18–25. – Бібліогр.: 10 назв.uk
dc.identifier.doihttps://doi.org/10.20535/kpisn.2020.4.226964
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/40454
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.relation.ispartofНаукові вісті КПІ : міжнародний науково-технічний журнал, 2020, № 4(131)uk
dc.rights.urihttp://creativecommons.org/licenses/by/4.0/uk
dc.subjectпоріг зображенняuk
dc.subjectспеціалізовані зображенняuk
dc.subjectзображення документівuk
dc.subjectamidationuk
dc.subjectimage thresholduk
dc.subjectspecialized imagesuk
dc.subjectdocument imagesuk
dc.subjectпорог изображенияuk
dc.subjectспециализированные изображенияuk
dc.subjectизображения документовuk
dc.subject.udc004.932.1uk
dc.titleМетоди визначення порогового значення зображення як спосіб покращення доповненої реальностіuk
dc.title.alternativeMethods of Determining the Threshold Value of Image as a Way to Improve Augmented Realityuk
dc.title.alternativeМетоды определения порогового значения изображения как способ улучшения дополненной реальностиuk
dc.typeArticleuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
NVKPI2020-4_02.pdf
Розмір:
1.03 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.01 KB
Формат:
Item-specific license agreed upon to submission
Опис: