Система оптичного розпізнавання тексту

dc.contributor.advisorКочура, Юрій Петрович
dc.contributor.authorСавенко, Єлизавета Валеріївна
dc.date.accessioned2023-08-24T10:03:48Z
dc.date.available2023-08-24T10:03:48Z
dc.date.issued2023
dc.description.abstractПояснювальна записка дипломного проєкту складається з 4 розділів, де в результаті розробляється система оптичного розпізнавання тексту. Попередньо розглядаються різні підходи для розв'язання цієї задачі, проводиться аналіз вже готових систем, а після пишеться власна система OCR, яка вбудована в бота для Telegram. У першому розділі розглядаються можливі підходи і готові рішення цієї задачі. У другому представлено роботу з датасетом. У третьому описані деталі розробки системи та математичний підхід до всіх використаних підходів та алгоритмів. У четвертому надані експерименти та запровадження налаштованої моделі в готовий продукт у вигляді Telegram бота. Система OCR для сегментації зображень використовує ручні ознаки, а модель розпізнавання у своїй основі має CNN архітектуру, яка навчалася на датасеті "UkrainianOCR". Код написаний мовою Python із застосуванням бібіліотек keras і tensorflow для навчання моделі глибокого навчання. Для написання бота було використано бібліотеку aiogram.uk
dc.description.abstractotherThe explanatory note of the thesis project consists of 4 chapters, where the optical text recognition system is developed. We first consider various approaches to solving this problem, analyze existing systems, and then write our own OCR system, which is built into a bot for Telegram. The first section discusses possible approaches and existing solutions to this problem. The second section describes how to work with the dataset. The third section describes the details of the system development and the mathematical approach to all the approaches and algorithms used. The fourth section presents experiments and implementation of the customized model into a finished product in the form of a Telegram bot. The OCR system for image segmentation uses manual features, and the recognition model is based on CNN architecture, which was trained on the UkrainianOCR dataset. The code was written in Python using keras and tensorflow libraries to train the deep learning model. The aiogram library was used to write the bot.uk
dc.format.extent118 с.uk
dc.identifier.citationСавенко, Є. В. Система оптичного розпізнавання тексту : дипломний проект … бакалавра : 123 Комп’ютерна інженерія / Савенко Єлизавета Валеріївна. – Київ, 2023. – 118 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/59446
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectOCRuk
dc.subjectCNNuk
dc.subjectоптичне розпізнавання текстуuk
dc.subjectdeep learninguk
dc.subjectpythonuk
dc.titleСистема оптичного розпізнавання текстуuk
dc.typeBachelor Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Savenko_bakalavr.pdf
Розмір:
5.44 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: