Система оптичного розпізнавання тексту

Савенко, Єлизавета Валеріївна

Система оптичного розпізнавання тексту

dc.contributor.advisor	Кочура, Юрій Петрович
dc.contributor.author	Савенко, Єлизавета Валеріївна
dc.date.accessioned	2023-08-24T10:03:48Z
dc.date.available	2023-08-24T10:03:48Z
dc.date.issued	2023
dc.description.abstract	Пояснювальна записка дипломного проєкту складається з 4 розділів, де в результаті розробляється система оптичного розпізнавання тексту. Попередньо розглядаються різні підходи для розв'язання цієї задачі, проводиться аналіз вже готових систем, а після пишеться власна система OCR, яка вбудована в бота для Telegram. У першому розділі розглядаються можливі підходи і готові рішення цієї задачі. У другому представлено роботу з датасетом. У третьому описані деталі розробки системи та математичний підхід до всіх використаних підходів та алгоритмів. У четвертому надані експерименти та запровадження налаштованої моделі в готовий продукт у вигляді Telegram бота. Система OCR для сегментації зображень використовує ручні ознаки, а модель розпізнавання у своїй основі має CNN архітектуру, яка навчалася на датасеті "UkrainianOCR". Код написаний мовою Python із застосуванням бібіліотек keras і tensorflow для навчання моделі глибокого навчання. Для написання бота було використано бібліотеку aiogram.	uk
dc.description.abstractother	The explanatory note of the thesis project consists of 4 chapters, where the optical text recognition system is developed. We first consider various approaches to solving this problem, analyze existing systems, and then write our own OCR system, which is built into a bot for Telegram. The first section discusses possible approaches and existing solutions to this problem. The second section describes how to work with the dataset. The third section describes the details of the system development and the mathematical approach to all the approaches and algorithms used. The fourth section presents experiments and implementation of the customized model into a finished product in the form of a Telegram bot. The OCR system for image segmentation uses manual features, and the recognition model is based on CNN architecture, which was trained on the UkrainianOCR dataset. The code was written in Python using keras and tensorflow libraries to train the deep learning model. The aiogram library was used to write the bot.	uk
dc.format.extent	118 с.	uk
dc.identifier.citation	Савенко, Є. В. Система оптичного розпізнавання тексту : дипломний проект … бакалавра : 123 Комп’ютерна інженерія / Савенко Єлизавета Валеріївна. – Київ, 2023. – 118 с.	uk
dc.identifier.uri	https://ela.kpi.ua/handle/123456789/59446
dc.language.iso	uk	uk
dc.publisher	КПІ ім. Ігоря Сікорського	uk
dc.publisher.place	Київ	uk
dc.subject	OCR	uk
dc.subject	CNN	uk
dc.subject	оптичне розпізнавання тексту	uk
dc.subject	deep learning	uk
dc.subject	python	uk
dc.title	Система оптичного розпізнавання тексту	uk
dc.type	Bachelor Thesis	uk

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: Savenko_bakalavr.pdf
Розмір:: 5.44 MB
Формат:: Adobe Portable Document Format
Опис:

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 9.1 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Бакалаврські роботи (ОТ)
Бакалаврські роботи