Система розпізнавання та перекладу тексту документів

Loading...
Thumbnail Image

Date

2024

Journal Title

Journal ISSN

Volume Title

Publisher

КПІ ім. Ігоря Сікорського

Abstract

Наразі вже існує чимало програмних продуктів, які дозволяють перекласти текст на зображенні документу. Однак більшість з них мають певні недоліки, які не дозволяють повністю автоматизувати цей процес. Головною проблемою є те, що вони не надають можливості отримати на виході іменовані сутності цього документу та їх перекладені версії, а також інструментарій для їх обліку, що є вкрай важливим у подібній сфері. Таким чином можна вважати, що розробка подібного продукту є досить актуальною потребою в наш час. Метою даної роботи є автоматизація процесу цифровізації та перекладу документів шляхом розробки програмного додатку, який дозволяє сканувати документи, визначати іменовані сутності (адреси, телефони, основний текст), перекладати їх та здійснювати облік. Об’єктом дослідження є процеси сканування фізичних документів, розпізнавання тексту на зображеннях та його переклад після визначення іменованих сутностей. Предметом дослідження є методи та засоби реалізації системи для обробки текстових даних за допомогою сучасних алгоритмів машинного навчання. Тези автора на тему «Штучний інтелект для виявлення та розпізнавання автомобільних номерів на базі архітектури глибокого навчання EfficientNet та адаптації розмірів анкорів» були опубліковані в збірнику «Сучасні аспекти та перспективні напрямки розвитку науки», 2024 рік. Стання автора «Провідні OCR моделі для розпізнавання тексту на зображеннях» опублікована в журналі «UNIVERSUM», 2024 рік.

Description

Keywords

обробка зображення, сканування документів, переклад тексту, іменовані сутності, класифікація даних, методи розпізнавання тексту

Citation

Патока, В. В. Система розпізнавання та перекладу тексту документів : магістерська дис. : 126 Інформаційні системи та технології / Патока Владислав Володимирович. – Київ, 2024. – 110 с.

DOI