Програмне забезпечення для автоматизації реєстрації паперових документів підприємства
| dc.contributor.advisor | Новак, Дмитро Сергійович | |
| dc.contributor.author | Защик, Іван Олександрович | |
| dc.date.accessioned | 2025-10-15T11:43:15Z | |
| dc.date.available | 2025-10-15T11:43:15Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | У сучасному діловому середовищі, де обсяг документації постійно зростає, ефективна обробка документів є критично важливою. Саме з цією метою був розроблений програмний комплекс для автоматизованого розпізнавання, аналізу та керування документацією. Рішення складається з двох частин – серверної, яка реалізована за допомогою Python та бібліотеки Tesseract OCR, та клієнтської, створеної у вигляді Windows-додатка. Серверна частина приймає PDF-файли або зображення, виконує оптичне розпізнавання тексту (OCR) та повертає розпізнаний вміст. На стороні клієнта здійснюється подальший аналіз цього тексту із застосуванням регулярних виразів для автоматичного виявлення ключових реквізитів, таких як номер документа, дата підписання, контрагент тощо. Користувачі мають змогу зручно працювати з базою записів: переглядати, фільтрувати, редагувати, завантажувати або видаляти документи. Передбачено також потужний функціонал для формування звітів: Excel-файл генерується на основі поточного набору записів (з урахуванням усіх фільтрів), а також формується ZIP-архів зі сканами, впорядкованими за датою та контрагентом. Інтерфейс програми є інтуїтивно зрозумілим і адаптованим під щоденне використання, що робить систему корисною як для офісних працівників, так і для спеціалістів, відповідальних за документообіг. Завдяки поєднанню технологій OCR, автоматичного аналізу тексту та зручного експорту звітності, розроблений інструмент істотно підвищує ефективність обробки документів. | |
| dc.description.abstractother | In today's business environment, where the volume of documentation is constantly increasing, efficient document processing becomes critically important. For this purpose, a software system was developed to automate the recognition, analysis, and management of documents. The solution consists of a server component, implemented using Python and the Tesseract OCR library, and a client component in the form of a Windows application. The server processes PDF files or images, performs optical character recognition (OCR), and returns the recognized text. On the client side, this text is analyzed using regular expressions to automatically extract key details such as document number, signing date, and counterparty name. Users can conveniently interact with the records database: viewing, filtering, editing, downloading, or deleting documents. The system also provides advanced reporting functionality: an Excel file is generated based on the currently filtered dataset, and a ZIP archive is created with scans organized by date and counterparty. The application's interface is intuitive and suitable for daily use, making the system valuable for office staff and documentation specialists alike. By combining OCR technology, automated text analysis, and convenient report export, the developed tool significantly improves the efficiency of document processing. | |
| dc.format.extent | 118 с. | |
| dc.identifier.citation | Защик, І. О. Програмне забезпечення для автоматизації реєстрації паперових документів підприємства : дипломний проєкт ... бакалавра : 121 Інженерія програмного забезпечення / Защик Іван Олександрович. – Київ, 2025. – 118 с. | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/76874 | |
| dc.language.iso | uk | |
| dc.publisher | КПІ ім. Ігоря Сікорського | |
| dc.publisher.place | Київ | |
| dc.title | Програмне забезпечення для автоматизації реєстрації паперових документів підприємства | |
| dc.type | Bachelor Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Zashchyk_bakalavr.pdf
- Розмір:
- 4.13 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: