Система розпізнавання та перекладу тексту документів
dc.contributor.advisor | Гавриленко, Олена Валеріївна | |
dc.contributor.author | Патока, Владислав Володимирович | |
dc.date.accessioned | 2025-03-11T08:11:31Z | |
dc.date.available | 2025-03-11T08:11:31Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Наразі вже існує чимало програмних продуктів, які дозволяють перекласти текст на зображенні документу. Однак більшість з них мають певні недоліки, які не дозволяють повністю автоматизувати цей процес. Головною проблемою є те, що вони не надають можливості отримати на виході іменовані сутності цього документу та їх перекладені версії, а також інструментарій для їх обліку, що є вкрай важливим у подібній сфері. Таким чином можна вважати, що розробка подібного продукту є досить актуальною потребою в наш час. Метою даної роботи є автоматизація процесу цифровізації та перекладу документів шляхом розробки програмного додатку, який дозволяє сканувати документи, визначати іменовані сутності (адреси, телефони, основний текст), перекладати їх та здійснювати облік. Об’єктом дослідження є процеси сканування фізичних документів, розпізнавання тексту на зображеннях та його переклад після визначення іменованих сутностей. Предметом дослідження є методи та засоби реалізації системи для обробки текстових даних за допомогою сучасних алгоритмів машинного навчання. Тези автора на тему «Штучний інтелект для виявлення та розпізнавання автомобільних номерів на базі архітектури глибокого навчання EfficientNet та адаптації розмірів анкорів» були опубліковані в збірнику «Сучасні аспекти та перспективні напрямки розвитку науки», 2024 рік. Стання автора «Провідні OCR моделі для розпізнавання тексту на зображеннях» опублікована в журналі «UNIVERSUM», 2024 рік. | |
dc.description.abstractother | The explanatory note of the diploma project consists of five sections, contains 28 table, 8 applications and 22 sources - a total of 110 pages. The object of study: an automated system used to process, recognize, analyze, and translate text from paper documents. The aim of the diploma project: to create software that will automate the processes of scanning documents, reading text, selecting named entities, and translating them. The first chapter of the work analyzes the subject area, in particular, modern technologies for text recognition and translation, analyzes their relevance in the context of automating document processing. Existing solutions, such as Google Translate, ABBYY FineReader, and Microsoft Translator, are considered, along with their advantages, disadvantages, and areas of application. Based on this analysis, the requirements for the software to be developed as part of the thesis were formulated. The second chapter describes in detail the selected technologies for creating the software product. The Python programming language, which provides high development flexibility, as well as the OpenCV libraries for working with images, PyTesseract for text recognition, and SpaCy for defining named entities, are considered. In addition, the capabilities of the Flask web framework for implementing the server side and the PostgreSQL database for data accounting, as well as the machine translation service DeepL for high-quality text translation are analyzed. The third chapter is devoted to the software implementation of the application under development. It proposes the software architecture, including a description of data flows in the system, business processes, and interaction between components. In particular, the software modules for scanning documents, extracting named entities, and translating text were described in detail. Special attention is paid to the development of a user interface that provides intuitive user interaction with the software product. The fourth section of the paper deals with the mathematical support of the project. It formulates the mathematical models used for text recognition and translation quality assessment. Experimental studies have been conducted, the results of which demonstrate the effectiveness of the applied methods, in particular the high accuracy of the NER model, the correspondence of the translated text to the original, and its readability. Chapter 5 discusses the possibility of launching the developed software product as a startup. The business idea was substantiated, market analysis and technological audit were conducted. Based on the data obtained, the author proposes a strategy for launching the product on the market, which takes into account its potential users and competitive advantages. | |
dc.format.extent | 110 с. | |
dc.identifier.citation | Патока, В. В. Система розпізнавання та перекладу тексту документів : магістерська дис. : 126 Інформаційні системи та технології / Патока Владислав Володимирович. – Київ, 2024. – 110 с. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/72823 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | обробка зображення | |
dc.subject | сканування документів | |
dc.subject | переклад тексту | |
dc.subject | іменовані сутності | |
dc.subject | класифікація даних | |
dc.subject | методи розпізнавання тексту | |
dc.subject.udc | 004.9 | |
dc.title | Система розпізнавання та перекладу тексту документів | |
dc.type | Master Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Patoka_magistr.pdf
- Розмір:
- 1.79 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: