Моделі та методи оброблення даних в системах з мікросервісною архітектурою
| dc.contributor.advisor | Корнага, Ярослав Ігорович | |
| dc.contributor.author | Губарєв, Олександр Миколайович | |
| dc.date.accessioned | 2026-05-25T12:08:45Z | |
| dc.date.available | 2026-05-25T12:08:45Z | |
| dc.date.issued | 2026 | |
| dc.description.abstract | Губарєв О. М. Моделі та методи оброблення даних в системах з мікросервісною архітектурою, рукопис. Дисертаційна робота на здобуття наукового ступеня доктора філософії за спеціальністю 126 «Інформаційні системи та технології», виконана у Національному технічному університеті України «Київський політехнічний інститут імені Ігоря Сікорського», м.Київ, 2026. Останніми десятиліттями розробники програмного забезпечення дедалі частіше відмовляються від монолітних систем і переходять на мікросервіси. Мікросервісна архітектура має кращі можливості для масштабування, більшу гнучкість і легкість в обслуговуванні. Однак, перехід з моноліту на мікросервіси це непросте завдання, оскільки у монолітах присутні приховані залежності, модулі тісно інтегровані один з одним, межі доменів практично відсутні, а процес ручної декомпозиції монолітної системи може бути тривалим і призвести до помилок. Тому дослідження і розробка автоматизованих рішень для переходу з монолітної архітектури на мікросервіси є актуальними на сьогоднішній день. Проблема декомпозиції вже вивчалася у межах різних наукових напрямів. Евристичні та метрик-орієнтовані підходи [98-100] використовували матриці залежностей, метрики зв’язаності та набори правил для поділу систем на сервіси, що дозволило отримати помірний рівень когезії, однак отримані кластери лише частково відповідали межам предметних доменів. Пізніше почали використовувати графові підходи, такі як Service Cutter, IBM Mono2Micro, DacomiCo та GDC-DVF, які використовували графи залежностей та підвищення рівня модульності для покращення структурного поділу системи. На основі результатів попередніх досліджень подальший розвиток отримали більш сучасні підходи, які використовують методи машинного навчання та спрямовані на автоматичне виявлення синтаксичних і семантичних взаємозв’язків між компонентами програмних систем. Desai таін. (2021) запропонували графову нейронну мережу (GNN) для зменшення впливу аномальних компонентів під час рефакторингу монолітних застосунків. Qian та ін. (2023) запропонували підхід глибокої кластеризації з інтеграцією двох представлень архітектури системи (dual-view fusion) для виділення мікросервісів. Yedida та ін. (2021, 2023) використали методи глибинного навчання для розподілу хмарних мікросервісних застосунків. Sellami та ін. (2022) використали ієрархічний алгоритм кластеризації DBSCAN для структурного рефакторингу. Ziabakhsh та ін. (2025) запропонували модель Mo2oM - м’яку кластеризацію (компоненти можуть частково належати до кількох мікросервісів) на основі графової нейронної мережі з використанням глибоких семантичних векторних подань. В результаті використання цих підходів, вдалося суттєво підвищити модульність та семантичну узгодженість кластерів. Однак вони демонструють чутливість до конфігурації даних, складнощі при поєднанні структурних і семантичних ознак, обмежену ефективність при усуненні надлишкових міжмодульних зв’язків та труднощі при узагальненні навчальних моделей для різнорідних програмних доменів. Сьогодні важливим науковим завданням є розробка методів автоматизовано переходу з монолітних програмних систем на мікросервіси, які можуть забезпечити структурну якість, семантичну узгодженість та можливість адаптації до різних предметних середовищ. Розв’язання цієї наукової задачі - необхідна передумова для підвищення масштабованості, надійності та семантичної узгодженості розподілених програмних систем. Мета дисертаційної роботи полягає у підвищенні архітектурної якості програмних систем з мікросервісною архітектурою шляхом дослідження та вдосконалення методів автоматизованого переходу з монолітної архітектури на мікросервісну. Дослідження виконано за допомогою використання методів статичного аналізу вихідного коду, теорії графів, алгоритмів пертворення графових структур (виявлення сильно зв’язаних компонент, надлишкових та циклічних залежностей), алгоритмів кластерного аналізу, графових нейронних мереж, а також багатокритеріального оцінювання внутрішньої узгодженості кластерів та міжкластерної зв’язності. Наукова новизна одержаних результатів полягає у наступному: Удосконалено метод статичного аналізу вихідного коду, який відрізняється від існуючих методів побудовою графа залежностей програмної системи з урахуванням вагових коефіцієнтів вузлів, які розраховані з використанням метрик їх структурної важливості та впливу на збереження зв’язності графа, а також поетапним структурним перетворенням графа залежностей перед кластеризацією (скорочення надлишкових та циклічних залежностей, об’єднання сильнозв’язних компонент), що забезпечує покращення топології графа та підвищує точність виявлення логічно відокремлених компонентів із чітко визначеними архітектурними межами. Вперше розроблено метод динамічного вибору алгоритму кластеризації, який враховує топологічні характеристики графа залежностей програмної системи і відрізняється від існуючих методів використанням механізму прийняття рішень, що дозволяє визначати алгоритм кластеризації відповідно до структурної складності, щільності, зв’язності та інших параметрів графа та підвищити якість декомпозиції для різнорідних архітектурних моделей. Вперше розроблено метод вдосконалення кластерної структури програмної системи, що виконує локальну перебудову кластерів на основі показників внутрішньої зв’язності, міжкластерних залежностей та семантичної узгодженості компонентів і відрізняється від існуючих методів застосуванням механізму вдосконалення, який дозволяє покращити структурні характеристики кластерів і враховує, при цьому, рівень семантичної узгодженості, що обчислюється за векторною подібністю назв та ключових доменних термінів, що дозволяє посилити внутрішню узгодженість кластерів, зменшити міжкластерну зв’язність та покращити відповідність архітектури функціональній структурі програмної системи. Удосконалено метод автоматизованого формування кластерної структури програмної системи шляхом модифікації графової нейронної моделі, який відрізняється від існуючих методів доповненням вхідних ознак вузлів структурними метриками та семантичними маркерами, а також застосуванням багатокритеріальної функції навчання, яка враховує внутрішню узгодженість компонентів, міжкластерну зв’язність і семантичну відповідність, що дозволяє забезпечити підвищення якості формування точності кластерної структури, зниження кількості надлишкових зв’язків і формування семантично однорідних компонентів. Набула подальшого розвитку інформаційна технологія автоматизованої трансформації монолітної архітектури у мікросервісну, яка реалізує повний цикл багатокрокової декомпозиції програмної системи - від статичного аналізу вихідного коду до навчання графової нейронної моделі із використанням поетапного структурного перетворення графа залежностей та динамічного вибору кластеризаційних алгоритмів. Інформаційна система, розроблена на основі запропонованої інформаційної технології, може бути використана для дослідження, моделювання та практичної реалізації процесів декомпозиції програмних систем різної предметної спрямованості. Результати, представлені у дисертаційній роботі, є комплексним вирішенням наукової проблеми забезпечення автоматизованої трансформації монолітних програмних систем у мікросервісну архітектуру з контрольованою міжсервісною зв’язаністю та високим рівнем внутрішньої узгодженості архітектурних компонентів і отримано наукові результати, які становлять вагомий внесок у розвиток інформаційних технологій для системного аналізу, дослідження, розробки архітектури та методів побудови програмних систем на основі мікросервісної архітектури. Проведені експериментальні дослідження та тестування інформаційної системи підтверджують її практичну придатність. Зокрема підвищення показника внутрішньої зв’язності компонентів, зниження кількості міжкластерних зв’язків та досягнення кращої семантичної узгодженості кластерів свідчить про покращення якості отриманої мікросервісної архітектури порівняно з відомими методами. Практичне значення отриманих результатів засвідчено актами впровадження розробленої інформаційної системи в КБ ІС КПІ ім. Ігоря Сікорського та ТОВ «Інтехфорвард». Перспективи подальших досліджень полягають у розширенні можливостей запропонованого підходу, яке полягає у застосуванні методу динамічного аналізу виконання програм, покращенні семантичних моделей за рахунок включення у вектор ознак інформації з документації та інтерфейсів API та дослідженні можливості використання нейромережевих моделей для автоматизованого розподілення структури бази даних між сервісами. | |
| dc.description.abstractother | Hubariev O. M. Models and methods of data processing in systems with microservice architecture, manuscript. Dissertation work for obtaining the scientific degree of Doctor of Philosophy in the specialty 126 «Information systems and technologies», performed at the National Technical University of Ukraine «Igor Sikorsky Kyiv Polytechnic Institute», Kyiv, 2026. In recent decades, software developers have increasingly abandoned monolithic systems and switched to microservices. Microservice architecture has better scalability, greater flexibility and ease of maintenance. However, switching from a monolith to microservices is not an easy task, since there are hidden dependencies in monoliths, modules are closely integrated with each other, domain boundaries are practically absent, and the process of manual decomposition of a monolithic system can be long and lead to errors. Therefore, the research and development of automated solutions for the transition from monolithic architecture to microservices are relevant today. The problem of decomposition has already been studied within various scientific directions. Heuristic and metric-oriented approaches [98-100] used dependency matrices, connectivity metrics, and rule sets to divide systems into services, allowing for a moderate level of cohesion, however the resulting clusters only partially corresponded to subject domain boundaries. Later, graph approaches such as Service Cutter, IBM Mono2Micro, DacomiCo, and GDC-DVF began to be used, which used dependency graphs and modularity optimization to improve the structural division of the system. Based on the results of previous research, more modern approaches that use machine learning methods and aim to automatically detect syntactic and semantic relationships between components of software systems have been further developed. Desai et al. (2021) proposed a graph neural network (GNN) to reduce the impact of abnormal components during refactoring of monolithic applications. Qian et al. (2023) proposed a deep clustering approach integrating two representations of the system architecture (dual-view fusion) to isolate microservices. Yedida et al. (2021, 2023) used deep learning methods to distribute cloud microservice applications. Sellami et al. (2022) used the hierarchical DBSCAN clustering algorithm for structural refactoring. Ziabakhsh et al. (2025) proposed a model of Mo2oM - soft clustering (components may belong in part to multiple microservices) based on a graph neural network using deep semantic vector representations. As a result of using these approaches, it was possible to significantly increase the modularity and semantic coherence of clusters. However, they exhibit sensitivity to data configuration, complexities when combining structural and semantic features, limited efficiency when eliminating redundant intermodular relationships, and difficulties in generalizing training models for heterogeneous software domains. Today, an important scientific task is the development of methods for the automated transition from monolithic software systems to microservices, which can ensure structural quality, semantic consistency and the possibility of adaptation to different subject environments. Solving this scientific problem is a necessary prerequisite for increasing the scalability, reliability and semantic consistency of distributed software systems. The purpose of the dissertation is to increase the architectural quality of software systems with microservice architecture by researching and improving methods of automated transition from monolithic to microservice architecture. The research was performed using methods of static analysis of source code, graph theory, algorithms for the transformation of graph structures (detection of strongly connected components, redundant and cyclic dependencies), algorithms for cluster analysis, graph neural networks, as well as multi-criteria evaluation of internal consistency of clusters and intercluster connectivity. The scientific novelty of the obtained results is as follows: The method of static analysis of the source code has been improved, which differs from existing methods by the construction of a graph of dependencies of the software system taking into account the weighting coefficients of nodes, which are calculated using metrics of their structural importance and influence on the preservation of the connectivity of the graph, as well as by stepwise structural transformation of the graph of dependencies before clustering (reduction of redundant and cyclic dependencies, unification of strongly connected components), which provides an improvement in the topology of the graph and increases the detection accuracy of logically separated components with well-defined architectural boundaries. For the first time, a method of dynamic selection of the clustering algorithm was developed, which takes into account the topological characteristics of the dependency graph of the software system and differs from existing methods by the use of a decision-making mechanism, which allows determining the clustering algorithm according to the structural complexity, density, connectivity and other parameters of the graph and to improve the quality of decomposition for heterogeneous architectural models. For the first time, a method of improving the cluster structure of a software system was developed, which performs a local rearrangement of clusters based on indicators of internal connectivity, intercluster dependencies and semantic consistency of components and differs from existing methods by applying an improvement mechanism that allows improving the structural characteristics of clusters and takes into account, at the same time, the level of semantic consistency, calculated by the vector similarity of names and key domain terms, which allows strengthening the internal consistency of clusters reduce inter-cluster connectivity and improve the relevance of the architecture to the functional structure of the software system. The method of automated formation of the cluster structure of the software system by modifying the graph neural model has been improved, which differs from existing methods by supplementing the input features of nodes with structural metrics and semantic markers, as well as by applying a multi-criteria learning function that takes into account the internal consistency of components, intercluster connectivity and semantic correspondence, which allows to ensure an increase in the quality of formation of accuracy of the cluster structure, a decrease in the number of redundant connections and the formation of semantically homogeneous components. The information technology of automated transformation of monolithic architecture into microservice architecture, which implements a full cycle of multistep decomposition of the software system - from static analysis of source code to training of a graph neural model using step-by-step structural transformation of the dependency graph and dynamic selection of clustering algorithms, has gained further development. The information system created according to the proposed information technology can be used for research, modeling and practical implementation of decomposition processes of software systems of various subject orientations. The dissertation presents the results, which, in accordance with the set goal, are a comprehensive solution to the scientific problem of ensuring the automated transformation of monolithic software systems into a microservice architecture with controlled interservice connectivity and a high level of internal consistency of architectural components, and the scientific results are obtained, which make a significant contribution to the development of information technologies for system analysis, research, development of architecture and methods of building software systems based on microservice architecture. Experimental studies and testing of the information system confirm its practical suitability. In particular, increasing the internal connectivity index of the components, reducing the number of intercluster connections and achieving better semantic consistency of the clusters indicates an improvement in the quality of the resulting microservice architecture compared to known methods. The practical significance of the obtained results is evidenced by the acts of implementation of the developed information system in the DB IS Igor Sikorsky Kyiv Polytechnic Institute and LLC ―Intechforward‖. Prospects for further research consist in expanding the possibilities of the proposed approach, which consists in applying the method of dynamic analysis of program execution, improving semantic models by including information from documentation and API interfaces in the feature vector, and the study of the possibility of using neural network models for automated distribution of the database structure between services. | |
| dc.format.extent | 200 с. | |
| dc.identifier.citation | Губарєв О. М. Моделі та методи оброблення даних в системах з мікросервісною архітектурою : дис. … д-ра філософії : 126 Інформаційні системи та технології / Губарєв Олександр Миколайович. – Київ, 2026. – 200 с. | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/81062 | |
| dc.language.iso | uk | |
| dc.publisher | КПІ ім. Ігоря Сікорського | |
| dc.publisher.place | Київ | |
| dc.subject | монолітна архітектура | |
| dc.subject | мікросервісна архітектура | |
| dc.subject | декомпозиція програмних систем | |
| dc.subject | архітектура програмного забезпечення | |
| dc.subject | статичний аналіз | |
| dc.subject | структурна модульність | |
| dc.subject | теорія графів | |
| dc.subject | машинне навчання | |
| dc.subject | нейронні мережі | |
| dc.subject | штучний інтелект | |
| dc.subject | глибоке навчання | |
| dc.subject | розподілені комп’ютерні системи | |
| dc.subject | інформаційні технології | |
| dc.subject | інформаційна система | |
| dc.subject | гетерогенні системи | |
| dc.subject | monolithic architecture | |
| dc.subject | microservice architecture | |
| dc.subject | software systems decomposition | |
| dc.subject | software architecture | |
| dc.subject | static analysis | |
| dc.subject | structural modularity | |
| dc.subject | graph theory | |
| dc.subject | machine learning | |
| dc.subject | neural networks | |
| dc.subject | artificial intelligence | |
| dc.subject | deep learning | |
| dc.subject | distributed computer systems | |
| dc.subject | information technology | |
| dc.subject | information system | |
| dc.subject | heterogeneous systems | |
| dc.subject.udc | 004.415.2:004.75 | |
| dc.title | Моделі та методи оброблення даних в системах з мікросервісною архітектурою | |
| dc.title.alternative | Models and methods of data processing in systems with microservice architecture | |
| dc.type | Thesis Doctoral |
Файли
Контейнер файлів
1 - 1 з 1
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: