Програмне забезпечення для виявлення та розпізнавання тексту в документах нетекстового формату
Вантажиться...
Дата
2025
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Розмір пояснювальної записки – 161 аркуш, містить 46 ілюстрацій, 24 таблиці, 6 додатків, 57 посилань на джерела.
Актуальність теми. У роботі розглянуто проблему зумовлена зростанням обсягів цифрової інформації, зокрема сканованих документів. Наявні програмні аналоги не забезпечують очікувано бажаний результат. Щоб отримати коректний текст, що буде відображати повністю оригінальний документ потрібно ефективні інструменти для його обробки та аналізу. Постійний прогрес в області машинного навчання та глибокого навчання відкриває нові можливості для підвищення точності та швидкості розпізнавання тексту. Технології OCR дозволяють автоматизувати рутинні завдання, такі як введення даних, архівування документів, пошук інформації, що підвищує продуктивність, знижує витрати та заощаджує час. Виявлено потребу в розробці програмного забезпечення виявлення та розпізнавання тексту в документах нетекстового формату шляхом застосування сучасних нейронних мереж.
Мета дослідження. Основною метою є покращити точність виявлення та розпізнавання тексту в документах нетекстового формату.
Об’єкт дослідження: програмне забезпечення розпізнавання тексту.
Предмет дослідження: метод, алгоритми та архітектура програмного забезпечення виявлення та розпізнавання тексту в документах нетекстового формату спрямовані на підвищення точності.
Для реалізації поставленої мети сформульовані наступні завдання:
一 проаналізувати наявні рішення для визначення потрібних покращень точність виявлення та розпізнавання тексту в документах нетекстового формату;
一 розробити метод з застосуванням сучасних нейронних мереж для виявлення та розпізнавання тексту в документах не текстового формату;
一 розробити програмне рішення;
一 дослідити та оцінити ефективність запропонованого рішення.
Наукова новизна результатів магістерської дисертації полягає в тому, що запропоновано узагальнену модель програмної системи OCR, яка описує повний цикл обробки зображення, від попередньої підготовки до післяобробки результату, та адаптована до роботи з різнорідними типами документів. Удосконалено підхід до виявлення тексту в нетекстових документах шляхом поєднання традиційних методів попередньої обробки та застосування глибинних архітектур нейронних мереж, що забезпечує підвищення точності розпізнавання тексту, швидкодії та продуктивності праці.
Практичне значення отриманих результатів полягає в тому, що реалізовані та поєднані методи обробки зображення, використання двох OCR-двигунів і автоматичного failback та фреймворку PyQt5 в межах одного застосунку простого використання та нативного інтерфейсу користувача. Дана система є корисна для державних підприємств при роботі з сканованими документами та зображеннями, що дозволить оптимізувати рутинні завдання з введення даних, архівування та підвищить продуктивність і заощадить час.
Зв’язок з науковими програмами, планами, темами. Робота виконувалась на кафедрі інформатики та програмної інженерії Національного технічного університету України "Київський політехнічний інститут імені Ігоря Сікорського".
Апробація. Наукові положення дисертації пройшли апробацію на IX Міжнародній науково-практичній конференції молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології» (SoftTech-2025) – м. Київ.
Публікації. Наукові положення дисертації опубліковані в:
1) Дишкант Л.Л. Програмне забезпечення виявлення та розпізнавання тексту в документах не текстового формату / Дишкант Л.Л., Крамар Ю.М. // Матеріали IX Міжнародної науково-практичної конференції молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології» (SoftTech-2025) – м. Київ: НТУУ «КПІ ім. Ігоря Сікорського», 26-28 листопада 2025 р.
Опис
Ключові слова
OCR, виявлення, розпізнавання тексту, CRNN, обробка зображення, нейронні мережі, detection, text recognition, image processing, neural networks
Бібліографічний опис
Дишкант, Л. Л. Програмне забезпечення для виявлення та розпізнавання тексту в документах нетекстового формату : магістерська дис. : 121 Інженерія програмного забезпечення / Дишкант Лариса Леонідівна. - Київ, 2025. - 161 с.