Методи та засоби проектування обчислювачів для розпізнавання образів у зображеннях
dc.contributor.advisor | Романкевич, Віталій Олексійович | |
dc.contributor.author | Сергієнко, Павло Анатолійович | |
dc.date.accessioned | 2023-11-01T09:24:49Z | |
dc.date.available | 2023-11-01T09:24:49Z | |
dc.date.issued | 2023 | |
dc.description.abstract | Тема дисертації пов’язана з розробкою алгоритмів оброблення зображень та з проєктуванням спеціалізованих обчислювальних засобів для їх реалізації на базі інтегральних схем надвисокої інтеграції (НВІС) та програмовних логічних інтегральних схем (ПЛІС). Об’єктом дослідження є розпізнавання образів у зображеннях та проєктування апаратних засобів для їх виконання. Предметом дослідження є алгоритми пошуку характерних точок у зображеннях та проєктування спеціалізованих обчислювальних систем для виконання цих алгоритмів. Метою дисертації є підвищення ефективності розробки обчислювальних систем для розпізнавання образів у зображеннях на основі ПЛІС та НВІС шляхом створення нових методів проєктування спеціалізованих конвеєрних структур, які дають змогу прискорити проєктування обчислювальних систем і підвищити відношення продуктивність — апаратні витрати завдяки формалізації проєктування та новим алгоритмам обробки зображень і пошуку характерних точок в них. Для досягнення мети в дисертації виконуються завдання: проаналізувати задачі, алгоритми і пристрої розпізнавання образів у зображеннях, зокрема, системи розпізнавання образів на основі штучних нейронних мереж і сформулювати вимоги до елементної бази й засобів проєктування обчислювальних систем для розпізнавання образів; теоретично обґрунтувати та розробити алгоритм пошуку характерних точок, тобто, локальних елементів зображення з найбільш інформативними ознаками, які необхідні для класифікації зображень, який на відміну від існуючих алгоритмів має меншу складність та забезпечує пошук у складних умовах освітлення; створити метод побудови буферних схем для обробки одно- та двохвимірних сигналів, який забезпечує заданий порядок слідування вхідних та вихідних даних і мінімізовані апаратні витрати при його реалізації у ПЛІС; розробити способи побудови допоміжних блоків для систем розпізнавання образів, таких як обчислювач елементарних функцій, декомпресор даних; перевірити ефективність розробленого методу при проєктуванні модулів спеціалізованої системи на базі ПЛІС для вирішення кола завдань розпізнавання образів. Наукова новизна роботи. Запропоновано новий метод пошуку характерних точок у зображенні, який на відміну від існуючих методів пошуку характерних точок, таких як scale-invariant feature transform (SIFT) та похідних від нього, завдяки використанню нового алгоритму адаптивної фільтрації, виконує пошук характерних точок у несприятливих умовах освітленості та має обсяг обчислень зменшений до чотирьох разів. Запропоновано новий алгоритм адаптивної фільтрації на основі блоку аналізу зображення, який детектує локальні градієнтні характеристики і формує з них зображення ознак за допомогою паралельної двовимірної фільтрації та селекції результатів фільтрації у логарифмічному масштабі, який на відміну від відомого алгоритму білатеральної фільтрації, має учетверо менше операцій множення, не потребує обчислень з підвищеною точністю і плаваючою комою та дає змогу обробляти зображення з динамічним діапазоном до 120 дб і більше. Створено метод синтезу буферних схем для обробки двовимірних потоків даних, який на відміну від існуючих методів дає змогу виконувати розробку буферних схем формалізовано з мінімізацією апаратних витрат, який, шляхом застосування методу просторового графа синхронних потоків даних, направляє синтез на одержання буферів типу FIFO або пам’яті довільного доступу, забезпечуючи наперед заданий порядок та період вводу-виводу даних. Запропоновано новий спосіб проектування буферних схем з конвеєрних регістрів у ПЛІС, який відрізняється від існуючих способів формальною побудовою функціональної схеми, в якій використовуються елементи SRL16, за рахунок чого p регістрів замінюються на k логічних таблиць і таким чином, основні апаратні витрати на регістри у ПЛІС зменшуються у p/k є [2..16] разів. Удосконалено алгоритм та структура апаратного модуля обчислення квадратного кореня, який на відміну від відомого алгоритму зі зсувом та відніманням і його апаратної реалізації має меншу латентну затримку обчислення за рахунок застосування блоків постійної пам’яті для збереження результатів перших ітерацій алгоритму. Практична цінність результатів дисертаційної роботи полягає в тому, що використання запропонованого методу пошуку характерних точок у зображенні у системах технічного зору дає змогу пришвидшити розпізнавання образів, зменшуючи латентну затримку між вводом зображення та виводом його ознак, покращити розпізнавання в несприятливих умовах освітлення, зменшити навантаження на лінії телекомунікацій за рахунок прорідження інформації. Новий метод синтезу буферних схем для обробки двовимірних потоків даних та новий спосіб проектування буферів з конвеєрних регістрів у ПЛІС дають змогу пришвидшити проєктування складних систем технічного зору. Інтелектуальна відеокамера, яка розроблена з їх застосуванням та в якій застосовано новий метод пошуку характерних точок, при своєму впровадженні здатна замінити камери відео-нагляду завдяки ефективному стисненню зображення з широким динамічним діапазоном та можливістю розпізнавання образів. Розроблений вперше апаратно-програмний модуль для LZW-декомпресії має невеликі апаратні витрати, може бути впроваджений у ПЛІС різних серій і завдяки цьому, у порівнянні з програмною реалізацією має вдвічі більшу пропускну здатність, може зменшити об'єм пам'яті та енергоспоживання і має можливість переналаштовуватись при відсутніх або невеликих додаткових апаратних витратах. Удосконалений алгоритм та структура модуля обчислення квадратного кореня впроваджені у Web-застосунку, що генерує модулі обчислення цієї функції з заданими параметрами швидкодії, точності, апаратних витрат, які вільно поширюються і можуть бути вбудовані в довільні проєкти ПЛІС. Результати роботи впроваджені у двох НДР, що проводяться Національному технічному університеті України «Київський політехнічний інститут імені Ігоря Сікорського» на кафедрах обчислювальної техніки та ситемного програмування і спеціалізованих комп’ютерних систем, які присвячені проєктуванню високопродуктивних апаратних і програмних засобів. Матеріали дисертації є корисними для викладачів і спеціалістів у галузях проєктування апаратних засобів обчислювальної техніки, систем телекомунікацій, зв’язку, вимірювання, штучного інтелекту, засобів мікроелектроніки, а також можуть бути застосовані у навчальному процесі у вищих навчальних закладах. | uk |
dc.description.abstractother | The topic of the thesis is related to the development of image processing algorithms and the design of application-specific computing tools for their implementation based on very large-scale integrated (VLSI) circuits and field programmable gate arrays (FPGA). The object of research is the image recognition and the design of hardware for their implementation. The subject of research is algorithms for feature extraction in images and application-specific computer systems design for these algorithms’ implementation. The purpose of the thesisis to increase the efficiency of the design of computational systems for pattern recognition in images based on FPGAs and VLSIs by developing new methods of application-specific pipeline structure design, which allows to speed up computational systems design and increases the performance-hardware cost ratio due to the formalization of design and new image processing and feature extraction algorithms. To achieve the purpose of the thesis, the following tasks are performed: the analysis of the problems, algorithms and devices of pattern recognition in images, in particular, pattern recognition systems based on artificial neural networks and formulation of requirements for the elemental basis and design tools of the computational systems for pattern recognition; theoretical substantiation and development of the algorithm for the extraction of feature points, i.e., local image elements with the most informative features that are necessary for image classification, which, unlike existing algorithms, has less complexity and provides the search in difficult lighting conditions; development of a method of the design of buffer circuits for processing one- and two-dimensional signals, which ensures a specified sequence of input and output data and minimized hardware costs when it is implemented in FPGA; development of the approaches to building auxiliary blocks for pattern recognition systems, such as a calculator of elementary functions, a data decompressor; assessment of the effectiveness of the developed method when designing modules of an application-specific system based on FPGA for solving a range of pattern recognition tasks. Scientific novelty of the work. A new method for feature extraction in images is proposed, which, unlike existing feature extraction methods, such as scale-invariant feature transform (SIFT) and derived from it, by using new algorithm of adaptive filtering, performs the feature extraction in adverse lighting conditions and has a volume of calculations reduced up to four times. A new adaptive filtering algorithm based on an image analysis block is proposed, which detects local gradient characteristics and forms an image of features using parallel two-dimensional filtering and selection of logarithmic-scale filtering results, which, unlike the well-known bilateral filtering algorithm, has four times fewer multiplication operations and does not require increased precision and floating point computations and capable to process images with a dynamic range of up to 120 dB and more. A method for the synthesis of buffer circuits for processing two-dimensional data streams has been created, which, unlike existing methods, allows the buffer design in a formalized manner with the minimization of hardware costs, which, by applying the method of a spatial synchronous dataflows, directs the synthesis to obtaining the FIFO buffers or RAM, ensuring a predetermined order of data input and output. A new method of designing buffers from pipeline registers in FPGAs is proposed, which differs from existing methods by the formal design of a functional network that uses SRL16 elements, due to which p registers are replaced by k logical tables and thus, the main hardware costs for registers in the FPGA are reduced by p/k є [2..16] times. The algorithm and structure of the hardware square root calculation module have been improved, which, unlike the well-known shift-and-subtract algorithm and its hardware implementation, has a lower latency calculation delay due to the use of ROM blocks to store the results of the first iterations of the algorithm. The practical value of the thesis results are that the use of the proposed method of feature extraction in the image in technical vision systems makes it possible to speed up pattern recognition, reducing the latent delay between the input of the image and the output of its features, to improve recognition in adverse lighting conditions, and to reduce the load on telecommunication lines due to information thinning. A new method of synthesizing buffers for processing two-dimensional data flows and a new way of designing buffers from pipeline registers in FPGAs make it possible to speed up the design of complex technical vision systems. An intelligent video camera, which is developed with their application and in which a new method of feature extraction is implemented, сan replace video surveillance cameras due to effective image compression with a high dynamic range and the pattern recognition ability. The first-developed hardware-software module for LZW decompression has low hardware costs, can be implemented in FPGAs of various series, and due to this, compared to the software implementation, it has twice the bandwidth, can reduce the amount of memory and power consumption, and has the reconfigurability with no or little additional hardware costs. The improved algorithm and structure of the square root calculation module are implemented in a Web application that generates the modules of this function calculation with given parameters of performance, accuracy, hardware costs, which are freely distributed and can be embedded in arbitrary FPGA projects. The results of the work have been implemented in two scientific research works held at the National Technical University of Ukraine " Ihor Sikorsky’s Kyiv Polytechnic Institute" at the departments of computer engineering and system programming, and specialized computer systems, which are dedicated to the design of high-performance hardware and software. The thesis materials are useful for teachers and specialists in the fields of computer hardware design, telecommunication systems, communication, measurement, artificial intelligence, microelectronics, and can also be used in the educational process at higher educational institutions. | uk |
dc.format.extent | 224 с. | uk |
dc.identifier.citation | Сергієнко, П. А. Методи та засоби проектування обчислювачів для розпізнавання образів у зображеннях : дис. … д-ра філософії : 123 Комп’ютерна інженерія / Сергієнко Павло Анатолійович. – Київ, 2023. – 224 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/61927 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | розпізнавання контурів | uk |
dc.subject | семантична сегментація | uk |
dc.subject | розпізнавання образів | uk |
dc.subject | стиснення даних | uk |
dc.subject | характерна точка | uk |
dc.subject | програмована логічна інтегральна схема | uk |
dc.subject | система на кристалі | uk |
dc.subject | класифікація | uk |
dc.subject | цифрова обробка зображень | uk |
dc.subject | структурний синтез | uk |
dc.subject | граф синхронних потоків даних | uk |
dc.subject | synchronous data flow | uk |
dc.subject | contour detection | uk |
dc.subject | edge computing | uk |
dc.subject | semantic segmentation | uk |
dc.subject | pattern recognition | uk |
dc.subject | data compression | uk |
dc.subject | feature point | uk |
dc.subject | field programmable gate array | uk |
dc.subject | system on chip | uk |
dc.subject | classification | uk |
dc.subject | digital image processing | uk |
dc.subject | structural synthesis | uk |
dc.subject.udc | 004.383 : 004.415.2 | uk |
dc.title | Методи та засоби проектування обчислювачів для розпізнавання образів у зображеннях | uk |
dc.type | Thesis Doctoral | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Serhiienko_dys.pdf
- Розмір:
- 6.3 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 1.71 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: