Методи та програмне забезпечення для аналізу продуктивності вебзастосунків на основі моделей машинного навчання

dc.contributor.advisorОлещенко, Любов Михайлівна
dc.contributor.authorБурчак, Павло Володимирович
dc.date.accessioned2026-05-11T08:07:00Z
dc.date.available2026-05-11T08:07:00Z
dc.date.issued2026
dc.description.abstractБурчак П. В. Методи та програмне забезпечення для аналізу продуктивності вебзастосунків на основі моделей машинного навчання – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії з галузі знань 12 Інформаційні технології за спеціальністю 121 Інженерія програмного забезпечення. – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2026. У сучасних вебзастосунках продуктивність є комплексною кількісною характеристикою його здатності забезпечувати обробку запитів та генерацію відповідей із заданими показниками швидкодії, пропускної здатності, масштабованості та використання обчислювальних ресурсів за визначених умов навантаження. Аналіз наявних засобів моніторингу вебзастосунків показав, що вони здебільшого орієнтовані на збирання та візуалізацію показників продуктивності. Вагомою проблемою є відсутність єдиної структури для аналізу вебзастосунків різних архітектур, врахування їх особливостей, а також відсутність механізмів пояснення, здатних визначати вплив відповідних факторів (ознак) на зміну показників продуктивності вебзастосунку. Вирішення цих проблем можливе через створення спеціалізованого програмного забезпечення (ПЗ), яке використовує модель ознак продуктивності, інтегрує методи пояснюваного машинного навчання та забезпечує адаптивний вибір архітектурного рішення відповідно до прогнозованих ризиків деградації. Методи прогнозування та пояснюваного машинного навчання широко застосовуються у фінансовій сфері, виробництві та медичних інформаційно-аналітичних системах. Натомість відсутні рішення, орієнтовані на інженерію продуктивності вебзастосунків та прийняття архітектурно-орієнтованих рішень на основі пояснюваних моделей. Попри те, що потреба у таких інструментах зростає, наявні системи не враховують складні структурні залежності між компонентами вебсистем, а також не інтегрують механізми автоматичного вибору архітектури. Тому актуальним є наукове завдання удосконалення теоретичних та методологічних основ аналізу продуктивності вебзастосунків з використанням моделей машинного навчання, пояснюваності та адаптивного архітектурного вибору, що виконується у даній дисертаційній роботі. Метою дисертаційної роботи є підвищення точності відбору ключових ознак, що визначають зміну показників продуктивності вебзастосунків та зменшення споживання ресурсів під час експлуатації цифрових вебсистем. У першому розділі дисертації проведено аналіз сучасних підходів та програмних засобів для моніторингу продуктивності вебзастосунків, оцінено можливості підходів наявних систем та визначено їх обмеження щодо універсальності, енергоефективності, пояснюваності та адаптивності архітектурних рекомендацій. Проведений аналіз існуючих систем моніторингу продуктивності вебзастосунків показав, що більшість з них є закритими комерційними рішеннями з обмеженою можливістю адаптації до різних архітектур вебзастосунків та недостатньою інтерпретацією результатів аналізу. Виявлено недоліки традиційних методів, що спираються на статичні моделі і ручне налаштування порогових значень та не враховують динаміку навантажень та розподілений характер обробки даних вебзастосунків. Сформульовано функціональні та нефункціональні вимоги до програмного забезпечення. У другому розділі на основі моделей машинного навчання розроблено методи відбору ключових ознак, що визначають зміну показників продуктивності вебзастосунків різної архітектури, які поєднують структурні, кореляційні та контекстно-адаптивні підходи до відбору ключових ознак продуктивності. Запропоновано графово-орієнтований метод визначення найважливіших ознак продуктивності, багатофакторну модель злиття телеметрії, а також спеціалізовані процедури для безсерверних та хмарних архітектур з динамічним масштабуванням. Запропоновані методи забезпечують пояснюваність аналізу завдяки SHAP-подібним індикаторам впливу ознак та дозволяють формувати інтерпретовані гіпотези щодо можливих причин деградації продуктивності вебсистем, формуючи основу для інтелектуального вибору архітектурних рішень. У третьому розділі проведено експериментальну перевірку запропонованих методів, включно з побудовою датасетів, навчанням моделей та їх валідацією на синтетичних та реальних телеметричних даних. Виконано порівняльний аналіз точності класифікації архітектур вебзастосунків, досліджено якість відбору ключових ознак, а також оцінено масштабованість та стійкість запропонованих моделей у сценаріях зростання навантаження. Додатково реалізовано інтерпретацію результатів за допомогою методів SHAP та LIME, що забезпечило інтерпретацію прогнозів та додаткову перевірку узгодженості виявлених статистичних залежностей. Для формування бази даних було здійснено збір телеметричної інформації, який об’єднав реальні дані з промислових систем та синтетично змодельовані сценарії навантаження. Дані отримувалися з корпоративних середовищ Kubernetes, AWS Lambda, Google Cloud Run та Azure App Services з використанням систем Prometheus, OpenTelemetry Collector та Jaeger. Процес навчання моделей машинного навчання реалізовувався в єдиному експериментальному середовищі на базі бібліотек PyTorch Lightning, MLflow та Spark ML. Отримані результати свідчать про наукову обґрунтованість та практичну доцільність застосування розроблених методів у досліджуваних умовах. У четвертому розділі розроблено архітектуру ПЗ для інтелектуального аналізу продуктивності вебзастосунків, яка поєднує модулі збору телеметрії, обробки даних, прогнозування, пояснюваного машинного навчання та надання рекомендацій веброзробникам. Запропоновано архітектурний шаблон, що автоматизує вибір архітектурного стилю за ознаками продуктивності. Розроблено вебінтерфейс та REST API для інтерактивної роботи з показниками продуктивності, трасуваннями та SHAP-поясненнями. Запропонована архітектура підтримує контейнеризоване розгортання, інтеграцію з інфраструктурою моніторингу та демонструє переваги щодо енергоефективності, точності рекомендацій та використання ресурсів. Наведено експериментальні дослідження аналізу вебзастосунків різної архітектури та порівняння розробленого програмного забезпечення з наявними рішеннями. У дисертаційній роботі отримано низку нових наукових результатів. Уперше запропоновано топологічно-орієнтований метод відбору ознак TAM-GNN, який, на відміну від класичних статистичних методів, враховує структурну взаємозалежність компонентів вебзастосунку за допомогою графових нейронних мереж GNN, що забезпечує підвищення точності виявлення критичних зон деградації продуктивності вебзастосунків у середньому на 27 %. Уперше розроблено кореляційно-графовий метод DCA-MicroNet, що, на відміну від класичних кореляційних методів, використовує графові нейронні мережі з механізмом уваги, SHAP-інтерпретації та пояснюваний аналіз міжсервісних залежностей, що дозволяє скоротити час локалізації «вузького місця» в мікросервісних вебзастосунках у середньому на 37 % Уперше запропоновано контекстно-адаптивний метод CMA-CloudNet, що, на відміну від статичних методів відбору ознак, поєднує механізми навчання з підкріпленням та контекстну адаптацію, що дозволяє зменшити час реакції системи аналізу продуктивності хмарних вебзастосунків у середньому на 27 %. Удосконалено багатофакторну модель злиття показників продуктивності AMF-MonoNet, яка, на відміну від традиційних моделей, поєднує PCA, LASSOрегуляризацію та аналіз взаємної інформації, забезпечуючи формування ортогоналізованого ядра ознак для монолітних вебсистем, що уможливлює зменшення середньої абсолютної похибки оцінювання часу відгуку монолітних вебзастосунків в середньому на 28 %. Розроблені методи та програмне забезпечення надають можливість автоматизованого аналізу продуктивності вебзастосунків з урахуванням архітектури системи та динаміки навантаження. Запропоноване програмне забезпечення дозволяє веброзробникам оперативно виявляти «вузькі місця» та оптимізувати роботу вебсервісів. Розроблене програмне забезпечення, на відміну від промислових APM-платформ, знижує використання CPU, RAM та енергоспоживання. Запропонована модель формування рекомендацій, на відміну від шаблонних порад у класичних моніторингових системах, враховує внесок кожної ознаки, ефект конкретної дії та підвищує релевантність рекомендацій. Запропонований архітектурний шаблон Adaptive Architectural Selection Pattern, на відміну від статичних APM-рішень, дозволяє автоматично адаптуватися до архітектурного класу вебзастосунку, забезпечуючи скорочення часу діагностики інцидентів. Запропонований метод CEA-ServerlessNet, на відміну від традиційного суцільного моніторингу, використовує багатокритеріальну та Байєсівську оптимізацію для адаптивного визначення частоти збору показників з урахуванням «холодних стартів», часу виклику функцій та вартості виконання обчислень, що дозволяє зменшити середню похибку оцінювання часу відгуку приблизно на 43 %. У дисертаційній роботі вирішене наукове завдання підвищення точності виявлення ключових ознак, що впливають на результати аналізу продуктивності вебзастосунків різної архітектури та зменшення споживання ресурсів під час експлуатації цифрових систем. Досягнуті результати забезпечують автоматизоване виявлення критичних аномалій, формування рекомендацій для веброзробників та зниження ресурсоспоживання під час моніторингу, що є особливо важливим у контексті використання цифрової інфраструктури України в умовах обмежених енергетичних ресурсів. Програмна реалізація запропонованих у дисертації методів може бути інтегрована в середовища DevOps та CI/CD, що дозволить підвищувати ефективність процесів розроблення, тестування та експлуатації вебзастосунків. Основні наукові результати дисертаційної роботи опубліковано у 9 наукових працях, зокрема, у 4 наукових статтях, опублікованих у фахових виданнях, включених до переліку наукових фахових видань України з присвоєнням категорії «Б», та у 5 матеріалах науково-технічних конференцій.
dc.description.abstractotherBurchak P.V. Methods and software for performance analysis of web applications using machine learning models – a qualifying scientific work (manuscript). Dissertation for the degree of Doctor of Philosophy in the field of knowledge 12 Information Technologies, specialty 121 Software Engineering. – National Technical University of Ukraine «Igor Sikorsky Kyiv Polytechnic Institute», Kyiv, 2026. In modern web applications, performance is a comprehensive quantitative characteristic of a system’s ability to process requests and generate responses with specified levels of latency, throughput, scalability, and computational resource utilization under defined workload conditions. An analysis of existing web application monitoring tools demonstrates that they are predominantly focused on performance indicators collection and visualization. A significant problem is the absence of a unified framework for analyzing web applications of different architectures, accounting for their specific characteristics, as well as the lack of explanation mechanisms capable of identifying the influence of relevant factors (features) on changes in web application performance indicators. Addressing these challenges requires the development of specialized software that employs a structured performance feature model, integrates explainable machine learning techniques, and supports adaptive architectural decision-making based on predicted degradation risks. Prediction and explanatory machine learning methods are widely used in finance, manufacturing, and medical information and analytical systems. However, solutions tailored to web application performance engineering and architecture-oriented decision-making based on explainable models remain largely unexplored. Despite the growing demand for such tools, existing systems do not adequately account for complex structural dependencies among web system components, nor do they incorporate mechanisms for automated architectural selection. Therefore, the scientific problem of advancing the theoretical and methodological foundations of web application performance analysis through the integration of machine learning models, explainability, and adaptive architectural selection is both relevant and timely, and it constitutes the focus of this dissertation research. The purpose of the dissertation is increasing the accuracy of identifying key features that determine changes in web application performance indicators and reducing resource consumption during the operation of digital web systems. In the first chapter of the dissertation, an analysis of current approaches and software tools for monitoring the performance of web applications was conducted. The capabilities of existing systems were evaluated, and their limitations regarding versatility, energy efficiency, explainability, and adaptability of architectural recommendations were identified. The analysis of existing web application performance monitoring systems showed that most of them are closed commercial solutions with limited adaptability to different architectures and insufficient interpretation of analysis results. The shortcomings of traditional methods that rely on static models and manual threshold settings, do not take into account the dynamics of loads and the distributed nature of web application data processing, were identified. Based on a review of existing web application performance monitoring systems, functional and non-functional software requirements were formulated to solve the identified tasks. In the second chapter, methods for identifying key features that determine changes in performance indicators of web applications with different architectures were developed based on machine learning models. These methods integrate topological, correlation-based, and context-adaptive approaches to performance features selection. A graph-oriented method for determining the most important performance indicators, a multifactor telemetry fusion model, as well as specialized procedures for serverless and cloud architectures with dynamic scaling are proposed. The proposed methods ensure explainability of the analysis through SHAP-like feature impact indicators and enable the formulation of interpretable hypotheses regarding the potential causes of web system performance degradation, thereby establishing a foundation for intelligent architectural decision-making. In the third chapter, an experimental verification of the proposed methods was carried out, including the construction of datasets, training models and their validation on synthetic and real telemetric data. A comparative analysis of the accuracy of the classification of web application architectures was performed, the quality of the selection of key features was investigated, and the scalability and stability of the proposed models in load growth scenarios were assessed. Additionally, result interpretation was implemented using the SHAP and LIME methods, which enabled transparent interpretation of model predictions and provided additional validation of the consistency of the identified statistical relationships. To form the database, telemetry information was collected, which combined real indicators from industrial systems and synthetically simulated load scenarios. Data was obtained from corporate environments Kubernetes, AWS Lambda, Google Cloud Run and Azure App Services using the Prometheus, OpenTelemetry Collector and Jaeger systems. The process of training machine learning models was implemented in a single experimental environment based on the PyTorch Lightning, MLflow and Spark ML libraries. The results obtained indicate the scientific validity and practical feasibility of applying the developed methods in the studied conditions. In the fourth chapter, a software architecture for intelligent analysis of web application performance was developed, which combines telemetry collection, data processing, forecasting, explained machine learning and recommendations modules. An Adaptive Architectural Selection Pattern is proposed that automates the selection of an architectural style based on performance characteristics. A web interface and REST API have been developed to enable interactive work with performance metrics, traces, and SHAP explanations. Proposed architecture supports containerized deployment, integration with monitoring infrastructure, and demonstrates benefits in terms of energy efficiency, recommendation accuracy, and resource utilization. Experimental research of the analysis of web applications of different architectures and comparison of the developed software with existing solutions are presented. In the dissertation, a number of new scientific results have been obtained. For the first time, a topology-oriented features selection method TAM-GNN is proposed, which, unlike classical statistical methods, takes into account the structural interdependencies of web application components using graph neural networks GNNs. This ensures an average improvement of 27% in the accuracy of identifying critical performance degradation zones in web applications. For the first time, a correlation–graph-based method DCA-MicroNet is developed, which, unlike classical correlation-based approaches, employs graph neural networks with an attention mechanism, SHAP-based interpretation, and explainable analysis of inter-service dependencies. This enables an average reduction of 37% in the time required to localize performance bottlenecks in microservice-based web applications. For the first time, a context-adaptive method CMA-CloudNet is proposed, which, in contrast to static features selection methods, combines reinforcement learning mechanisms with contextual adaptation. This makes it possible to reduce the response time of cloud web application performance analysis systems by an average of 27%. The multifactor performance features fusion model AMF-MonoNet has been improved, which, unlike traditional models, integrates PCA, LASSO regularization, and mutual information analysis. This ensures the formation of an orthogonalized and information-balanced features core for monolithic web systems, enabling an average reduction of 28% in the mean absolute error of response time estimation for monolithic web applications. The developed methods and software provide the capability for automated performance analysis of web applications, taking into account system architecture and workload dynamics. The proposed software enables web developers to promptly identify performance bottlenecks and optimize web service operations. Unlike commercial APM platforms, the developed software reduces CPU and RAM usage as well as energy consumption. The proposed recommendation generation model, unlike the template-based advice in classical monitoring systems, considers the contribution of each feature, the effect of specific actions, and increases the relevance of recommendations. The proposed architectural pattern, Adaptive Architectural Selection Pattern, unlike static APM solutions, allows automatic adaptation to the architectural class of the web application, reducing incident diagnosis time. The proposed method, CEA-ServerlessNet, unlike traditional continuous monitoring, employs multi-criteria and Bayesian optimization to adaptively determine the frequency of features collection, considering cold starts, function invocation time, and computation costs, which reduces the average latency estimation error by approximately 43%. The dissertation addresses the scientific problem of improving the accuracy of identifying key features that influence web application performance analysis across different architectures and reducing resource consumption during the operation of digital systems. This is achieved through the development of an adaptive architectural model, methods for classifying architectures based on telemetry data, and explainable machine learning techniques. The obtained results provide automated detection of critical anomalies, generation of recommendations for web developers, and reduction of resource consumption during monitoring, which is particularly important in the context of Ukraine’s digital infrastructure under energy resource constraints. The software implementation of the methods proposed in the dissertation can be integrated into DevOps and CI/CD environments, enhancing the efficiency of web application development, testing, and operational processes. The main scientific results of the dissertation have been published in 9 scientific works, including 4 scientific articles published in professional journals included in the list of scientific journals of Ukraine in category “Б”, as well as 5 materials of scientific and technical conferences.
dc.format.extent210 с.
dc.identifier.citationБурчак, П. В. Методи та програмне забезпечення для аналізу продуктивності вебзастосунків на основі моделей машинного навчання : дис. ... д-ра філософії : 121 Інженерія програмного забезпечення / Бурчак Павло Володимирович. - Київ, 2026. - 210 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/80749
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectінженерія програмного забезпечення
dc.subjectархітектура програмного забезпечення
dc.subjectархітектурні рішення
dc.subjectпродуктивність вебзастосунків
dc.subjectпопередня обробка даних
dc.subjectграф
dc.subjectмашинне навчання
dc.subjectоптимізація
dc.subjectнейронна мережа
dc.subjectмоніторинг
dc.subjectсистеми моніторингу
dc.subjectпрогнозування
dc.subjectметрики продуктивності
dc.subjectпрограмування
dc.subjectsoftware engineering
dc.subjectsoftware architecture
dc.subjectarchitectural solutions
dc.subjectweb application performance
dc.subjectdata preprocessing
dc.subjectgraph
dc.subjectmachine learning
dc.subjectoptimization
dc.subjectneural network
dc.subjectmonitoring
dc.subjectmonitoring systems
dc.subjectprediction
dc.subjectperformance metrics
dc.subjectprogramming
dc.subject.udc004.9:004.4
dc.titleМетоди та програмне забезпечення для аналізу продуктивності вебзастосунків на основі моделей машинного навчання
dc.title.alternativeMethods and software for performance analysis of web applications using machine learning models
dc.typeThesis Doctoral

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Burchak_dys.pdf
Розмір:
4.21 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: