Методи попередньої обробки зображень історичних документів для підвищення якості розпізнавання

dc.contributor.advisorЖелезняков, Дмитро Валентинович
dc.contributor.authorДенисенко, Анастасія Володимирівна
dc.date.accessioned2026-06-08T12:36:05Z
dc.date.available2026-06-08T12:36:05Z
dc.date.issued2026
dc.description.abstractДипломна робота містить 68 сторінок, 1 додаток, 10 зображення, 3 таблиці, і посилається на 26 джерел. Дипломна робота присвячена дослідженню та порівняльному аналізу класичних та нейромережевих методів бінаризації зображень історичних документів для підвищення якості подальшого розпізнавання тексту (OCR). У роботі проаналізовано типи підходів за архітектурою алгоритмів, а також види деградацій історичних документів (плями, вицвітання, прояв тексту зі зворотної сторони). Окрема увага приділяється вибору функцій втрат при навчанні моделей, що дозволяє суттєво підвищити точність збереження деталей символів та особливостей шрифтів. Основу дослідження становлять класичні адаптивні методи Оцу (Otsu) і Саувола (Sauvola), а також архітектури глибокого навчання: U-Net, Residual U-Net та Attention U-Net. Для навчання та оцінки нейромережевих моделей було застосовано різні функції втрат: MSE, комбіновану BCE+Dice loss та VGG16 perceptual loss. Реалізацію всіх методів виконано мовою Python із використанням бібліотек PyTorch, OpenCV, NumPy та Scikit-image. Для підвищення стійкості моделей до пошкоджень було реалізовано модуль для додавання синтетичних пошкоджень (гаусів шум, розмиття та імітація протікання чорнил). Було проведено аналіз методів бінаризації при обробці історичних документів з різними синтетичними пошкодженнями. Проаналізовано залежності якості бінаризації від специфіки архітектури та обраної функції втрат за метриками якості зображення (PSNR, F-Measure, SSIM) та відсоток помилок символів (CER/WER) після етапу розпізнавання тексту.
dc.description.abstractotherThe qualification work contains: 68 pages, 1 appendix, 10 images, 3 tables, and refers to 26 sources. The thesis is devoted to the study and comparative analysis of classical and neural network methods for binarization of images of historical documents to improve the quality of subsequent text recognition (OCR). The article analyzes the types of approaches by algorithm architecture, as well as types of degradation of historical documents (spots, fading, bleed through). Special attention is paid to the choice of loss functions when training models, which allows to significantly increase the accuracy of preserving character details and font features. The basis of the research is the classical adaptive methods of Otsu and Sauvola, as well as deep learning architectures: U-Net, Residual U-Net and Attention U-Net. Various loss functions were used to train and evaluate neural network models: MSE, combined BCE+Dice loss and VGG16 perceptual loss. All methods were implemented in Python using PyTorch, OpenCV, NumPy and Scikit-image libraries. To increase the robustness of models to damage, a module was implemented for adding synthetic damage (Gaussian noise, blurring and simulated ink leakage). An analysis of binarization methods for processing historical documents with various synthetic damage was conducted. The dependence of binarization quality on the architecture specifics and the selected loss function was analyzed by image quality metrics (PSNR, F-Measure, SSIM) and the percentage of character errors (CER/WER) after the text recognition stage.
dc.format.extent68 с.
dc.identifier.citationДенисенко, А. В. Методи попередньої обробки зображень історичних документів для підвищення якості розпізнавання : дипломна робота ... бакалавра : 113 Прикладна математика / Денисенко Анастасія Володимирівна. – Київ, 2026. – 68 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/81533
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectбінаризація зображень
dc.subjectісторичні документи
dc.subjectрозпізнавання тексту
dc.subjectOCR
dc.subjectU-Net
dc.subjectметод Саувола
dc.subjectметод Оцу
dc.subjectфункції втрат
dc.subjectперцептивна втрата
dc.subject.udc004.93:004.8
dc.titleМетоди попередньої обробки зображень історичних документів для підвищення якості розпізнавання
dc.typeBachelor Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Denysenko_bakalavr.pdf
Розмір:
5.29 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: