Метод для автоматичної перевірки документів на відповідність нормативним вимогам
| dc.contributor.author | Вербовий, Д. С. | |
| dc.contributor.author | Саяпіна, І. О. | |
| dc.date.accessioned | 2026-05-19T12:14:29Z | |
| dc.date.available | 2026-05-19T12:14:29Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Ця стаття присвячена розробці ефективного методу автоматичної перевірки форматів документів, який дозволяє гарантувати їх відповідність певним стандартам форматування. Переглянуто та проаналізовано наявні підходи, що використовують системи на основі правил і методи машинного навчання. Запропоновано модифікований метод, який об’єднує як структурну, так і лінгвістичну перевірку. Проведено порівняльний аналіз запропонованого методу з наявними підходами. Також запропоновано потенційні напрямки подальших досліджень. | |
| dc.description.abstractother | This paper focuses on developing an efficient method for automatically verifying document formats, ensuring they meet specific formatting standards. Existing approaches utilizing rule-based systems and machine learning techniques are reviewed and analyzed. A modified method that integrates both structural and linguistic checks is proposed. A comparative analysis of the proposed method against existing approaches is conducted. Potential directions for further research are proposed as well. The study reviews current approaches, including rule-based systems and machine learning techniques, evaluating their effectiveness in detecting formatting inconsistencies. While rule-based methods offer precision and transparency, they are limited in adaptability to complex document structures. Conversely, machine learning techniques demonstrate greater flexibility but often require extensive labeled datasets and struggle with interpretability. To address these challenges, a hybrid approach is proposed, combining structural analysis with linguistic verification. This method integrates predefined formatting rules with natural language processing methods to enhance accuracy and adaptability. The proposed system is implemented using Word API for structural verification, while LanguageTool API is used to analyze textual aspects to identify stylistic and linguistic deviations. Key formatting aspects evaluated include font consistency, margins, line spacing, paragraph alignment, and numbering styles. Additionally, NLP responses are filtered using Levenstein distance to prevent false and senseless results. | |
| dc.format.pagerange | С. 181-187 | |
| dc.identifier.citation | Вербовий, Д. С. Метод для автоматичної перевірки документів на відповідність нормативним вимогам [Електронний ресурс] / Д. С. Вербовий, І. О. Саяпіна // Системні технології. — 2025. — № 3(158). — С. 181-187. — Бібліогр.: 9 назв. — Назва з екрана. | |
| dc.identifier.doi | https://doi.org/10.34185/1562-9945-3-158-2025-18 | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/80905 | |
| dc.language.iso | uk | |
| dc.publisher | Український державний університет науки і технологій | |
| dc.publisher.place | Дніпро | |
| dc.relation.ispartof | Системні технології, 2025, № 3(158) | |
| dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
| dc.subject | автоматична перевірка документів | |
| dc.subject | нормативні вимоги | |
| dc.subject | форматування DOCX | |
| dc.subject | LanguageTool API | |
| dc.subject | Word API | |
| dc.subject | відстань Левенштейна | |
| dc.subject | структурний аналіз тексту | |
| dc.subject | оптимізація перевірки тексту | |
| dc.subject | automatic document validation | |
| dc.subject | regulatory requirements | |
| dc.subject | DOCX formatting | |
| dc.subject | Levenshtein distance | |
| dc.subject | structural text analysis | |
| dc.subject | text validation optimization | |
| dc.subject.udc | 004.4:004.8:681.3.06:004.912 | |
| dc.title | Метод для автоматичної перевірки документів на відповідність нормативним вимогам | |
| dc.title.alternative | Method for automatic document verification for compliance with regulatory requirements | |
| dc.type | Article |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- System_technologies_3(158)_2025_181-187.pdf
- Розмір:
- 584 KB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: