Інформаційна система розпізнавання тексту технології класифікації додатків до атестатів

dc.contributor.advisorФіногенов, Олексій Дмитрович
dc.contributor.authorМарченков, Іван Денисович
dc.date.accessioned2020-12-16T10:26:31Z
dc.date.available2020-12-16T10:26:31Z
dc.date.issued2020
dc.description.abstractenStructure and scope of work. The explanatory note of the graduate project consists of five paragraphs, contains 31 figures, 7 tables, 1 addition, 24 sources. Thesisbachelor'sthesisconsiders the problems that arise when processing images of appendices to the certificates of entrants during the admission campaign, on the example of the analysis of more than 30 thousand images of appendices to the certificate submitted to Igor Sikorsky Kyiv Polytechnic Institute in 2018. Typical examples of images of documents are given and conclusions about the possibility of automatic determination of the average score on the basis of scanned copies are made. The paragraph of information support indicates how the data enters the system, how the image data set is formed, how the image is pre-processed to teach the model. The paragraph of mathematical support is presented by meaningful and mathematical formulations of the problem for further analysis of the method of solving the problem, demonstrating the detailed application of mathematical methods. First of all, the possible methods of image classification are analyzed and the emphasis is placed on the use of convolutional neural networks (CNN), which are the most modern algorithm for classification and recognition of objects in the image. The solution method is described in detail: neural network architecture, model weight control algorithms and layer types. The softmax function will be used for the output layer, ReLU for other layers. The software is implemented in Python. Python is currently the most popular programming language for research and development in machine learning, and the Tensorflow library, developed by Google, has been used to build and train neural networks. The technology paragraph specifies which tools must be installed on the PC to run the product successfully. Tests were conducted to demonstrate the correct operation of the program.uk
dc.description.abstractukСтруктура та обсяг роботи.Пояснювальна записка дипломного проєкту складається з п’яти розділів, містить 31 рисунок, 7 таблиць, 1 додаток, 24 джерела. Дипломна бакалаврська робота розглядає проблеми, які виникають при обробці зображень додатків до атестатів абітурієнтів під час вступної кампанії, на прикладі аналізу більше 30 тисяч зображень додатків до атестата, поданих в КПІ ім. Ігоря Сікорського в 2018 році. Наведені типові приклади зображень документів і зроблені висновки про можливість автоматичного визначення середнього балу на підставі сканованих копій. У розділі інформаційного забезпечення вказано, яким чином дані потрапляють до системи, як формується набір даних зображень, як попередньо оброблюється зображення для навчання моделі. Розділ математичного забезпечення представлений змістовною та математичною постановками задачі для подальшого аналізу способу вирішення завдання, демонструючи детальне застосування математичних методів. У першу чергу проаналізовано можливі методи класифікації зображень та зроблений акцент на застосуванні згорткових нейронних мереж (CNN), які єнайсучаснішим алгоритмом класифікації та розпізнавання об’єктів на зображенні. Детально описано метод розв’язання: архітектура нейронної мережі, алгоритми регуляції вагів моделі та типи шарів. для шару виходу використовуватиметься функція softmax, для інших шарів –ReLU. Програмне забезпеченняреалізовано на мовоюPython.На даний момент Python є найпопулярнішою мовою програмування для досліджень та розробок у машинному навчанні, а для побудови та тренування нейронних мереж застосовано бібліотеку Tensorflow, розробленою компанією Google. У технологічному розділі вказано, які інструменти повинні бути встановлені на ПК для вдалого запуску продукту. Проведено тести, які демонструють коректність роботи програми.uk
dc.format.page107 с.uk
dc.identifier.citationМарченков, І. Д. Інформаційна система розпізнавання тексту технології класифікації додатків до атестатів : дипломний проект ... бакалавра : 122 Комп'ютерні науки та інформаційні технології / Марченков Іван Денисович. - Київ, 2020. - 107 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/38083
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectатестатuk
dc.subjectкласифікація документівuk
dc.subjectобробка зображеньuk
dc.subjectмашинне навчанняuk
dc.subjectнейронні мережіuk
dc.subjectcertificateuk
dc.subjectdocument classificationuk
dc.subjectimage processinguk
dc.subjectmachine learninguk
dc.subjectneural networksuk
dc.subject.udc004.032.26, 004.514, 004.62, 004.85, 004.93uk
dc.titleІнформаційна система розпізнавання тексту технології класифікації додатків до атестатівuk
dc.typeBachelor Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Marchenkov_bakalavr.pdf
Розмір:
3.5 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.16 KB
Формат:
Item-specific license agreed upon to submission
Опис: