Моделі та методи оброблення даних в системах з мікросервісною архітектурою

Губарєв, Олександр Миколайович

Моделі та методи оброблення даних в системах з мікросервісною архітектурою

Файли

Hubariev_dys.pdf (4.33 MB)

Дата

2026

Автори

Губарєв, Олександр Миколайович

Науковий керівник

Корнага, Ярослав Ігорович

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Губарєв О. М. Моделі та методи оброблення даних в системах з мікросервісною архітектурою, рукопис. Дисертаційна робота на здобуття наукового ступеня доктора філософії за спеціальністю 126 «Інформаційні системи та технології», виконана у Національному технічному університеті України «Київський політехнічний інститут імені Ігоря Сікорського», м.Київ, 2026. Останніми десятиліттями розробники програмного забезпечення дедалі частіше відмовляються від монолітних систем і переходять на мікросервіси. Мікросервісна архітектура має кращі можливості для масштабування, більшу гнучкість і легкість в обслуговуванні. Однак, перехід з моноліту на мікросервіси це непросте завдання, оскільки у монолітах присутні приховані залежності, модулі тісно інтегровані один з одним, межі доменів практично відсутні, а процес ручної декомпозиції монолітної системи може бути тривалим і призвести до помилок. Тому дослідження і розробка автоматизованих рішень для переходу з монолітної архітектури на мікросервіси є актуальними на сьогоднішній день. Проблема декомпозиції вже вивчалася у межах різних наукових напрямів. Евристичні та метрик-орієнтовані підходи [98-100] використовували матриці залежностей, метрики зв’язаності та набори правил для поділу систем на сервіси, що дозволило отримати помірний рівень когезії, однак отримані кластери лише частково відповідали межам предметних доменів. Пізніше почали використовувати графові підходи, такі як Service Cutter, IBM Mono2Micro, DacomiCo та GDC-DVF, які використовували графи залежностей та підвищення рівня модульності для покращення структурного поділу системи. На основі результатів попередніх досліджень подальший розвиток отримали більш сучасні підходи, які використовують методи машинного навчання та спрямовані на автоматичне виявлення синтаксичних і семантичних взаємозв’язків між компонентами програмних систем. Desai таін. (2021) запропонували графову нейронну мережу (GNN) для зменшення впливу аномальних компонентів під час рефакторингу монолітних застосунків. Qian та ін. (2023) запропонували підхід глибокої кластеризації з інтеграцією двох представлень архітектури системи (dual-view fusion) для виділення мікросервісів. Yedida та ін. (2021, 2023) використали методи глибинного навчання для розподілу хмарних мікросервісних застосунків. Sellami та ін. (2022) використали ієрархічний алгоритм кластеризації DBSCAN для структурного рефакторингу. Ziabakhsh та ін. (2025) запропонували модель Mo2oM - м’яку кластеризацію (компоненти можуть частково належати до кількох мікросервісів) на основі графової нейронної мережі з використанням глибоких семантичних векторних подань. В результаті використання цих підходів, вдалося суттєво підвищити модульність та семантичну узгодженість кластерів. Однак вони демонструють чутливість до конфігурації даних, складнощі при поєднанні структурних і семантичних ознак, обмежену ефективність при усуненні надлишкових міжмодульних зв’язків та труднощі при узагальненні навчальних моделей для різнорідних програмних доменів. Сьогодні важливим науковим завданням є розробка методів автоматизовано переходу з монолітних програмних систем на мікросервіси, які можуть забезпечити структурну якість, семантичну узгодженість та можливість адаптації до різних предметних середовищ. Розв’язання цієї наукової задачі - необхідна передумова для підвищення масштабованості, надійності та семантичної узгодженості розподілених програмних систем. Мета дисертаційної роботи полягає у підвищенні архітектурної якості програмних систем з мікросервісною архітектурою шляхом дослідження та вдосконалення методів автоматизованого переходу з монолітної архітектури на мікросервісну. Дослідження виконано за допомогою використання методів статичного аналізу вихідного коду, теорії графів, алгоритмів пертворення графових структур (виявлення сильно зв’язаних компонент, надлишкових та циклічних залежностей), алгоритмів кластерного аналізу, графових нейронних мереж, а також багатокритеріального оцінювання внутрішньої узгодженості кластерів та міжкластерної зв’язності. Наукова новизна одержаних результатів полягає у наступному: Удосконалено метод статичного аналізу вихідного коду, який відрізняється від існуючих методів побудовою графа залежностей програмної системи з урахуванням вагових коефіцієнтів вузлів, які розраховані з використанням метрик їх структурної важливості та впливу на збереження зв’язності графа, а також поетапним структурним перетворенням графа залежностей перед кластеризацією (скорочення надлишкових та циклічних залежностей, об’єднання сильнозв’язних компонент), що забезпечує покращення топології графа та підвищує точність виявлення логічно відокремлених компонентів із чітко визначеними архітектурними межами. Вперше розроблено метод динамічного вибору алгоритму кластеризації, який враховує топологічні характеристики графа залежностей програмної системи і відрізняється від існуючих методів використанням механізму прийняття рішень, що дозволяє визначати алгоритм кластеризації відповідно до структурної складності, щільності, зв’язності та інших параметрів графа та підвищити якість декомпозиції для різнорідних архітектурних моделей. Вперше розроблено метод вдосконалення кластерної структури програмної системи, що виконує локальну перебудову кластерів на основі показників внутрішньої зв’язності, міжкластерних залежностей та семантичної узгодженості компонентів і відрізняється від існуючих методів застосуванням механізму вдосконалення, який дозволяє покращити структурні характеристики кластерів і враховує, при цьому, рівень семантичної узгодженості, що обчислюється за векторною подібністю назв та ключових доменних термінів, що дозволяє посилити внутрішню узгодженість кластерів, зменшити міжкластерну зв’язність та покращити відповідність архітектури функціональній структурі програмної системи. Удосконалено метод автоматизованого формування кластерної структури програмної системи шляхом модифікації графової нейронної моделі, який відрізняється від існуючих методів доповненням вхідних ознак вузлів структурними метриками та семантичними маркерами, а також застосуванням багатокритеріальної функції навчання, яка враховує внутрішню узгодженість компонентів, міжкластерну зв’язність і семантичну відповідність, що дозволяє забезпечити підвищення якості формування точності кластерної структури, зниження кількості надлишкових зв’язків і формування семантично однорідних компонентів. Набула подальшого розвитку інформаційна технологія автоматизованої трансформації монолітної архітектури у мікросервісну, яка реалізує повний цикл багатокрокової декомпозиції програмної системи - від статичного аналізу вихідного коду до навчання графової нейронної моделі із використанням поетапного структурного перетворення графа залежностей та динамічного вибору кластеризаційних алгоритмів. Інформаційна система, розроблена на основі запропонованої інформаційної технології, може бути використана для дослідження, моделювання та практичної реалізації процесів декомпозиції програмних систем різної предметної спрямованості. Результати, представлені у дисертаційній роботі, є комплексним вирішенням наукової проблеми забезпечення автоматизованої трансформації монолітних програмних систем у мікросервісну архітектуру з контрольованою міжсервісною зв’язаністю та високим рівнем внутрішньої узгодженості архітектурних компонентів і отримано наукові результати, які становлять вагомий внесок у розвиток інформаційних технологій для системного аналізу, дослідження, розробки архітектури та методів побудови програмних систем на основі мікросервісної архітектури. Проведені експериментальні дослідження та тестування інформаційної системи підтверджують її практичну придатність. Зокрема підвищення показника внутрішньої зв’язності компонентів, зниження кількості міжкластерних зв’язків та досягнення кращої семантичної узгодженості кластерів свідчить про покращення якості отриманої мікросервісної архітектури порівняно з відомими методами. Практичне значення отриманих результатів засвідчено актами впровадження розробленої інформаційної системи в КБ ІС КПІ ім. Ігоря Сікорського та ТОВ «Інтехфорвард». Перспективи подальших досліджень полягають у розширенні можливостей запропонованого підходу, яке полягає у застосуванні методу динамічного аналізу виконання програм, покращенні семантичних моделей за рахунок включення у вектор ознак інформації з документації та інтерфейсів API та дослідженні можливості використання нейромережевих моделей для автоматизованого розподілення структури бази даних між сервісами.

Ключові слова

монолітна архітектура, мікросервісна архітектура, декомпозиція програмних систем, архітектура програмного забезпечення, статичний аналіз, структурна модульність, теорія графів, машинне навчання, нейронні мережі, штучний інтелект, глибоке навчання, розподілені комп’ютерні системи, інформаційні технології, інформаційна система, гетерогенні системи, monolithic architecture, microservice architecture, software systems decomposition, software architecture, static analysis, structural modularity, graph theory, machine learning, neural networks, artificial intelligence, deep learning, distributed computer systems, information technology, information system, heterogeneous systems

Бібліографічний опис

Губарєв О. М. Моделі та методи оброблення даних в системах з мікросервісною архітектурою : дис. … д-ра філософії : 126 Інформаційні системи та технології / Губарєв Олександр Миколайович. – Київ, 2026. – 200 с.

URI

https://ela.kpi.ua/handle/123456789/81062

Зібрання

Дисертації (ІСТ)
Дисертації (вільний доступ)

Повна інформація про документ

Моделі та методи оброблення даних в системах з мікросервісною архітектурою

Файли

Дата

Автори

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Опис

Ключові слова

Бібліографічний опис

ORCID

URI

DOI

Зібрання