Математичне та програмне забезпечення системи пошуку судових прецедентів в судочинстві України

dc.contributor.advisorМаслянко, Павло Павлович
dc.contributor.authorМірко, Сергій Сергійович
dc.date.accessioned2024-05-29T08:26:39Z
dc.date.available2024-05-29T08:26:39Z
dc.date.issued2023
dc.description.abstractДисертацію виконано на 130 аркушах, вона містить 2 додатки та перелік посилань на використані джерела з 24 найменувань. У роботі наведено 22 рисунків та 7 таблиць. Актуальність теми. База судових рішень в судочинстві України, які знаходяться в єдиному реєстрі судових рішень, перевищує сто мільйонів документів. До того ж вона містить декілька різновидів судових документів, таких як рішення, постанова, ухвала, вирок тощо, також має три рівні судочинства - перша інстанція, апеляція та касація, при цьому маючи досить розгалужене категорювання справ. Особливістю організації інформаційних ресурсів судочинства України є специфіка структур організації баз даних, форматів даних, процесів обробки даних, форматів запитів та інтерфейсів взаємодії з інформаційними ресурсами. Можна сказати, що в Україні де-факто існує прецедентне право, тобто раніше прийняті рішення по судових справах у відповідності до законодавства України використовуються для прийняття рішення щодо вирішення поточних справ, тобто на практиці судді використовують раніше прийняті рішення для винесення рішень по своїх поточних справах, а адвокати для розуміння того, як правильно побудувати свою правову позицію. Також в судочинстві України існують інші зацікавлені сторони, наприклад слідчі, представники влади, прокуратури тощо. Тому для інформатизації бізнес-процесів діяльності зацікавлених осіб у судочинстві України існують системи пошуку прецедентів серед вироків, рішень, ухвал та інших документів. Але існуючі системи потребують значного часу, щоб задовільнити потребу користувача у пошуку потрібного судового документа через обмежену функціональність взаємодії користувача з системою. Тому, наразі, актуальною є проблема розробки науково обґрунтованої концептуальної моделі системи пошуку прецедентів (СПП) у судочинстві України, яка б взаємодіяла з користувачем під час пошуку прецедентів з використанням підходів інтелектуального аналізу тексту та її імплементація на множині відкритих баз даних для забезпечення пошуку прецедентів серед законодавчо встановлених видів результатів судочинства України. Зв’язок роботи з науковими програмами, планами, темами. Дисертаційна робота виконувалась згідно з планом науково-дослідних робіт кафедри прикладної математики Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського». Мета і задачі дослідження. Метою є створення математичного, програмного та методичного забезпечення системи пошуку судових прецедентів в судочинстві України, яка б взаємодіяла з користувачем під час пошуку прецедентів з використанням підходів інтелектуального аналізу тексту. Для досягнення постановленої мети необхідно виконати наступні задачі: - Виконати аналіз існуючих систем пошуку прецедентів в судочинстві України - Виконати аналіз та огляд існуючих теоретичних рішень побудови систем пошуку прецедентів в судочинстві України - Виконати огляд перспективних рішень для побудови системи пошуку прецедентів в судочинстві України - Розробити уніфіковану модель системи пошуку прецедентів в судочинстві України - Розробити та описати математичне забезпечення пошуку прецедентів в судочинстві України - Розробити та описати програмне забезпечення пошуку прецедентів в судочинстві України - Провести верифікацію та валідацію пошуку прецедентів в судочинстві України Об’єкт дослідження. Методи та моделі інформаційно-пошукових систем (ІПС); підходи та функції розрахунку відповідності документа до запиту користувача; моделі, методи та алгоритми інтелектуального аналізу тексту: обробка природньої мови, представлення текстів, вилучення інформації, групування текстів; методи та підходи системної інженерії, систематизації, моделювання та проектування систем; існуючі програмні методи реалізації інформаційно-пошукових систем, існуючі системи пошуку прецедентів в судочинстві України: Єдиний державний реєстр судових рішень, Закон онлайн, База правових позицій Верховного Суду. Предмет дослідження. Системна інженерія та модель СПП на основі бізнес-профіля Еріксона–Пенкера; методи теорії системного аналізу, системної інженерії, моделювання та проектування систем пошуку текстів, розрахунку відповідності документа запиту, обробки природної мови, тематичного моделювання текстів, вилучення ключових слів, візуалізації даних; програмне забезпечення реалізації текстового пошуку ElasticSearch. Методи дослідження. Для вирішення поставленої задачі було розглянуто, методологію системної інженерії, методи та технології науки про дані, методи: тематичного моделювання текстів: LDA, NMF, Top2Vec, BERTopic; виділення ключових слів: на основі функцій подібності, Rake/Yake, на основі PageRank (графові), на основі енбедінгів; функції відповідності документа запиту користувача: TF-IDF (частота терміну до інвертованої частоти документу), Best Match 25, Divergence From Randomness Divergence From Information, Мовні моделі (Діріхле та Єлінек-Мерсер), Information Based. Огляд існуючих систем пушку прецедентів в судочинстві України: Єдиний державний реєстр судових рішень, Закон онлайн, База правових позицій Верховного Суду. Наукова новизна одержаних результатів включає в себе такі пункти: - Розроблено уніфіковану модель системи пошуку прецедентів в судочинстві України, яка б взаємодіяла з користувачем в процесі пошуку із застосуванням алгоритмів інтелектуального аналізу тексту. - Запропоновано підхід імплементації тематичного моделювання документів в систему пошуку прецедентів в судочинстві України. - Запропоновано підхід та алгоритм рекомендування пошукових слів на основі оцінок релевантності документів користувача. Практичне значення одержаних результатів. Запропоновано математичне, програмне та методичне забезпечення системи пошуку судових прецедентів в судочинстві України, яка взаємодіє з користувачем під час пошуку прецедентів з використанням підходів інтелектуального аналізу тексту, що пришвидшує пошук та аналіз судових документів в судочинстві України. Система збирає розмічені користувачем документи, як релевантні та нерелевантні до запиту, що дає можливість створити розмічений датасет судових документів. Датасет можна використати для модернізації системи, навчивши на ньому більш складні алгоритми інтелектуального аналізу тексту. Апробація результатів дисертації. Основні положення та результати роботи дисертації доповідалися та були опубліковані у матеріалах наукової конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг - ПМК-2022» . Публікації. Результати дисертації викладено в науковій праці: тези «Математичне та програмне забезпечення системи пошуку прецедентів в судочинстві України» конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг - ПМК-2022».
dc.description.abstractotherThe thesis is completed on 130 sheets, it contains 2 appendices and a list of references to the used sources from 24 names. The work contains 22 figures and 7 tables. Topic relevance. The base of court decisions in the judiciary of Ukraine, which are in the single register of court decisions, exceeds one hundred million documents. In addition, it contains several types of court documents, such as a decision, resolution, resolution, sentence, etc., and also has three levels of judicial proceedings - first instance, appeal and cassation, while having a rather extensive categorization of cases. The peculiarity of the organization of information resources of the judiciary of Ukraine is the specificity of the structures of the organization of databases, data formats, data processing processes, request formats and interfaces for interaction with information resources. It can be said that there is a de facto case law in Ukraine, i.e. previously adopted decisions on court cases in accordance with the legislation of Ukraine are used to make decisions on the resolution of current cases, i.e. in practice judges use previously adopted decisions to render decisions on their current cases, and lawyers to understand how to correctly build their legal position. There are also other interested parties in the judiciary of Ukraine, such as investigators, representatives of the authorities, prosecutors, etc. Therefore, in order to inform the business processes of the activities of interested parties in the judiciary of Ukraine, there are systems for searching for precedents among verdicts, decisions, resolutions and other documents. But the existing systems take a long time to satisfy the user's need to find the right court document due to the limited functionality of the user's interaction with the system. Therefore, at present, the problem of developing a scientifically based conceptual model of the system of finding precedents (SFP) in the judiciary of Ukraine, which would interact with the user during the search for precedents using the approaches of intellectual text analysis, and its implementation on a set of open databases to ensure the search for precedents among legally established types of results of the judicial proceedings of Ukraine. Thesis connection to scientific programs, plans, and topics. The dissertation work was carried out in accordance with the plan of research works of the Department of Applied Mathematics of the National Technical University of Ukraine "Ihor Sikorskyi Kyiv Polytechnic Institute". Research goal and objectives. The goal is to create a mathematical, software and methodological support system for searching court precedents in the judiciary of Ukraine, which would interact with the user during the search for precedents using the approaches of intellectual text analysis. To achieve the set goal, the following tasks must be completed: - To perform an analysis of the existing systems of finding precedents in the judiciary of Ukraine - To perform an analysis and review of existing theoretical solutions for the construction of systems for finding precedents in the judiciary of Ukraine - To carry out a review of promising solutions for building a system of finding precedents in the judiciary of Ukraine - To develop a unified model of the system of finding precedents in the judiciary of Ukraine - Develop and describe mathematical support for finding precedents in the judiciary of Ukraine - Develop and describe software for finding precedents in the judiciary of Ukraine - To verify and validate the search for precedents in the judiciary of Ukraine Object of research. Methods and models of information search systems (IPS); approaches and functions for calculating the compliance of a document with a user's request; models, methods and algorithms of intellectual text analysis: natural language processing, text presentation, information extraction, text grouping; methods and approaches of system engineering, systematization, modeling and system design; existing software methods for implementing information and search systems, existing systems for finding precedents in the judiciary of Ukraine: the Unified State Register of Court Decisions, the Law Online, the Base of Legal Positions of the Supreme Court. Subject of research. System engineering and SPP model based on Erickson-Penker business profile; methods of the theory of system analysis, system engineering, modeling and design of text search systems, calculation of correspondence to a request document, natural language processing, thematic text modeling, keyword extraction, data visualization; ElasticSearch text search implementation software. Methods of research. To solve the problem, the methodology of system engineering, methods and technologies of data science, methods of: thematic modeling of texts were considered: LDA, NMF, Top2Vec, BERTopic; selection of keywords: based on similarity functions, Rake/Yake, based on PageRank (graph), based on embeddings; functions of matching a document to a user request: TF-IDF (term frequency to inverse document frequency), Best Match 25, Divergence From Randomness Divergence From Information, Language models (Dirichlet and Jelinek-Mercer), Information Based. Review of the existing systems of precedents in the judiciary of Ukraine: the Unified State Register of Court Decisions, the Law Online, the Base of Legal Positions of the Supreme Court. Scientific contribution of the obtained results includes the following items: - A unified model of the system for searching precedents in the judiciary of Ukraine was developed, which would interact with the user in the search process using algorithms of intellectual text analysis. - The approach of implementing thematic modeling of documents into the system of finding precedents in the judiciary of Ukraine is proposed. - An approach and algorithm for recommending search terms based on the relevancy ratings of the user's documents is proposed. Practical value of obtained results. Mathematical, software and methodological support for the system of searching for court precedents in the judiciary of Ukraine is offered, which interacts with the user during the search for precedents using the approaches of intellectual text analysis, which speeds up the search and analysis of court documents in the judiciary of Ukraine. The system collects documents marked by the user as relevant and irrelevant to the query, which makes it possible to create a marked dataset of court documents. The dataset can be used to modernize the system by training more complex algorithms of intelligent text analysis on it. Approbation of the thesis results. The main provisions and results of the dissertation work were reported and published in the materials of the scientific conference of master's and postgraduate students "Applied mathematics and computing - PMK-2022". Publications. The results of the dissertation are presented in the scientific work: theses "Mathematical and software of the system of finding precedents in the judiciary of Ukraine" of the master's and postgraduate conference "Applied mathematics and computing - PMK-2022".
dc.format.extent158 с.
dc.identifier.citationМірко, С. С. Математичне та програмне забезпечення системи пошуку судових прецедентів в судочинстві України : магістерська дис. : 113 Прикладна математика / Мірко Сергій Сергійович. – Київ, 2023. – 158 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/66939
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectсистеми пошуку прецедентів в судочинстві України
dc.subjectсистемна інженерія
dc.subjectбізнес-профіль Еріксона-Пенкера
dc.subjectLDA
dc.subjectвилучення ключових слів на основі функцій подібності
dc.subjectрекомендування пошукових слів
dc.subject.udc519.688
dc.titleМатематичне та програмне забезпечення системи пошуку судових прецедентів в судочинстві України
dc.typeMaster Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Mirko_magistr.pdf
Розмір:
3.37 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: