Система оптичного розпізнавання тексту
dc.contributor.advisor | Кочура, Юрій Петрович | |
dc.contributor.author | Савенко, Єлизавета Валеріївна | |
dc.date.accessioned | 2023-08-24T10:03:48Z | |
dc.date.available | 2023-08-24T10:03:48Z | |
dc.date.issued | 2023 | |
dc.description.abstract | Пояснювальна записка дипломного проєкту складається з 4 розділів, де в результаті розробляється система оптичного розпізнавання тексту. Попередньо розглядаються різні підходи для розв'язання цієї задачі, проводиться аналіз вже готових систем, а після пишеться власна система OCR, яка вбудована в бота для Telegram. У першому розділі розглядаються можливі підходи і готові рішення цієї задачі. У другому представлено роботу з датасетом. У третьому описані деталі розробки системи та математичний підхід до всіх використаних підходів та алгоритмів. У четвертому надані експерименти та запровадження налаштованої моделі в готовий продукт у вигляді Telegram бота. Система OCR для сегментації зображень використовує ручні ознаки, а модель розпізнавання у своїй основі має CNN архітектуру, яка навчалася на датасеті "UkrainianOCR". Код написаний мовою Python із застосуванням бібіліотек keras і tensorflow для навчання моделі глибокого навчання. Для написання бота було використано бібліотеку aiogram. | uk |
dc.description.abstractother | The explanatory note of the thesis project consists of 4 chapters, where the optical text recognition system is developed. We first consider various approaches to solving this problem, analyze existing systems, and then write our own OCR system, which is built into a bot for Telegram. The first section discusses possible approaches and existing solutions to this problem. The second section describes how to work with the dataset. The third section describes the details of the system development and the mathematical approach to all the approaches and algorithms used. The fourth section presents experiments and implementation of the customized model into a finished product in the form of a Telegram bot. The OCR system for image segmentation uses manual features, and the recognition model is based on CNN architecture, which was trained on the UkrainianOCR dataset. The code was written in Python using keras and tensorflow libraries to train the deep learning model. The aiogram library was used to write the bot. | uk |
dc.format.extent | 118 с. | uk |
dc.identifier.citation | Савенко, Є. В. Система оптичного розпізнавання тексту : дипломний проект … бакалавра : 123 Комп’ютерна інженерія / Савенко Єлизавета Валеріївна. – Київ, 2023. – 118 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/59446 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | Київ | uk |
dc.subject | OCR | uk |
dc.subject | CNN | uk |
dc.subject | оптичне розпізнавання тексту | uk |
dc.subject | deep learning | uk |
dc.subject | python | uk |
dc.title | Система оптичного розпізнавання тексту | uk |
dc.type | Bachelor Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Savenko_bakalavr.pdf
- Розмір:
- 5.44 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: