Інформаційна система розпізнавання тексту технології класифікації додатків до атестатів
dc.contributor.advisor | Фіногенов, Олексій Дмитрович | |
dc.contributor.author | Марченков, Іван Денисович | |
dc.date.accessioned | 2020-12-16T10:26:31Z | |
dc.date.available | 2020-12-16T10:26:31Z | |
dc.date.issued | 2020 | |
dc.description.abstracten | Structure and scope of work. The explanatory note of the graduate project consists of five paragraphs, contains 31 figures, 7 tables, 1 addition, 24 sources. Thesisbachelor'sthesisconsiders the problems that arise when processing images of appendices to the certificates of entrants during the admission campaign, on the example of the analysis of more than 30 thousand images of appendices to the certificate submitted to Igor Sikorsky Kyiv Polytechnic Institute in 2018. Typical examples of images of documents are given and conclusions about the possibility of automatic determination of the average score on the basis of scanned copies are made. The paragraph of information support indicates how the data enters the system, how the image data set is formed, how the image is pre-processed to teach the model. The paragraph of mathematical support is presented by meaningful and mathematical formulations of the problem for further analysis of the method of solving the problem, demonstrating the detailed application of mathematical methods. First of all, the possible methods of image classification are analyzed and the emphasis is placed on the use of convolutional neural networks (CNN), which are the most modern algorithm for classification and recognition of objects in the image. The solution method is described in detail: neural network architecture, model weight control algorithms and layer types. The softmax function will be used for the output layer, ReLU for other layers. The software is implemented in Python. Python is currently the most popular programming language for research and development in machine learning, and the Tensorflow library, developed by Google, has been used to build and train neural networks. The technology paragraph specifies which tools must be installed on the PC to run the product successfully. Tests were conducted to demonstrate the correct operation of the program. | uk |
dc.description.abstractuk | Структура та обсяг роботи.Пояснювальна записка дипломного проєкту складається з п’яти розділів, містить 31 рисунок, 7 таблиць, 1 додаток, 24 джерела. Дипломна бакалаврська робота розглядає проблеми, які виникають при обробці зображень додатків до атестатів абітурієнтів під час вступної кампанії, на прикладі аналізу більше 30 тисяч зображень додатків до атестата, поданих в КПІ ім. Ігоря Сікорського в 2018 році. Наведені типові приклади зображень документів і зроблені висновки про можливість автоматичного визначення середнього балу на підставі сканованих копій. У розділі інформаційного забезпечення вказано, яким чином дані потрапляють до системи, як формується набір даних зображень, як попередньо оброблюється зображення для навчання моделі. Розділ математичного забезпечення представлений змістовною та математичною постановками задачі для подальшого аналізу способу вирішення завдання, демонструючи детальне застосування математичних методів. У першу чергу проаналізовано можливі методи класифікації зображень та зроблений акцент на застосуванні згорткових нейронних мереж (CNN), які єнайсучаснішим алгоритмом класифікації та розпізнавання об’єктів на зображенні. Детально описано метод розв’язання: архітектура нейронної мережі, алгоритми регуляції вагів моделі та типи шарів. для шару виходу використовуватиметься функція softmax, для інших шарів –ReLU. Програмне забезпеченняреалізовано на мовоюPython.На даний момент Python є найпопулярнішою мовою програмування для досліджень та розробок у машинному навчанні, а для побудови та тренування нейронних мереж застосовано бібліотеку Tensorflow, розробленою компанією Google. У технологічному розділі вказано, які інструменти повинні бути встановлені на ПК для вдалого запуску продукту. Проведено тести, які демонструють коректність роботи програми. | uk |
dc.format.page | 107 с. | uk |
dc.identifier.citation | Марченков, І. Д. Інформаційна система розпізнавання тексту технології класифікації додатків до атестатів : дипломний проект ... бакалавра : 122 Комп'ютерні науки та інформаційні технології / Марченков Іван Денисович. - Київ, 2020. - 107 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/38083 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | атестат | uk |
dc.subject | класифікація документів | uk |
dc.subject | обробка зображень | uk |
dc.subject | машинне навчання | uk |
dc.subject | нейронні мережі | uk |
dc.subject | certificate | uk |
dc.subject | document classification | uk |
dc.subject | image processing | uk |
dc.subject | machine learning | uk |
dc.subject | neural networks | uk |
dc.subject.udc | 004.032.26, 004.514, 004.62, 004.85, 004.93 | uk |
dc.title | Інформаційна система розпізнавання тексту технології класифікації додатків до атестатів | uk |
dc.type | Bachelor Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Marchenkov_bakalavr.pdf
- Розмір:
- 3.5 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.16 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: