Методи та програмне забезпечення для аналізу продуктивності вебзастосунків на основі моделей машинного навчання

Бурчак, Павло Володимирович

Методи та програмне забезпечення для аналізу продуктивності вебзастосунків на основі моделей машинного навчання

Файли

Burchak_dys.pdf (4.21 MB)

Дата

2026

Автори

Бурчак, Павло Володимирович

Науковий керівник

Олещенко, Любов Михайлівна

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Бурчак П. В. Методи та програмне забезпечення для аналізу продуктивності вебзастосунків на основі моделей машинного навчання – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії з галузі знань 12 Інформаційні технології за спеціальністю 121 Інженерія програмного забезпечення. – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2026. У сучасних вебзастосунках продуктивність є комплексною кількісною характеристикою його здатності забезпечувати обробку запитів та генерацію відповідей із заданими показниками швидкодії, пропускної здатності, масштабованості та використання обчислювальних ресурсів за визначених умов навантаження. Аналіз наявних засобів моніторингу вебзастосунків показав, що вони здебільшого орієнтовані на збирання та візуалізацію показників продуктивності. Вагомою проблемою є відсутність єдиної структури для аналізу вебзастосунків різних архітектур, врахування їх особливостей, а також відсутність механізмів пояснення, здатних визначати вплив відповідних факторів (ознак) на зміну показників продуктивності вебзастосунку. Вирішення цих проблем можливе через створення спеціалізованого програмного забезпечення (ПЗ), яке використовує модель ознак продуктивності, інтегрує методи пояснюваного машинного навчання та забезпечує адаптивний вибір архітектурного рішення відповідно до прогнозованих ризиків деградації. Методи прогнозування та пояснюваного машинного навчання широко застосовуються у фінансовій сфері, виробництві та медичних інформаційно-аналітичних системах. Натомість відсутні рішення, орієнтовані на інженерію продуктивності вебзастосунків та прийняття архітектурно-орієнтованих рішень на основі пояснюваних моделей. Попри те, що потреба у таких інструментах зростає, наявні системи не враховують складні структурні залежності між компонентами вебсистем, а також не інтегрують механізми автоматичного вибору архітектури. Тому актуальним є наукове завдання удосконалення теоретичних та методологічних основ аналізу продуктивності вебзастосунків з використанням моделей машинного навчання, пояснюваності та адаптивного архітектурного вибору, що виконується у даній дисертаційній роботі. Метою дисертаційної роботи є підвищення точності відбору ключових ознак, що визначають зміну показників продуктивності вебзастосунків та зменшення споживання ресурсів під час експлуатації цифрових вебсистем. У першому розділі дисертації проведено аналіз сучасних підходів та програмних засобів для моніторингу продуктивності вебзастосунків, оцінено можливості підходів наявних систем та визначено їх обмеження щодо універсальності, енергоефективності, пояснюваності та адаптивності архітектурних рекомендацій. Проведений аналіз існуючих систем моніторингу продуктивності вебзастосунків показав, що більшість з них є закритими комерційними рішеннями з обмеженою можливістю адаптації до різних архітектур вебзастосунків та недостатньою інтерпретацією результатів аналізу. Виявлено недоліки традиційних методів, що спираються на статичні моделі і ручне налаштування порогових значень та не враховують динаміку навантажень та розподілений характер обробки даних вебзастосунків. Сформульовано функціональні та нефункціональні вимоги до програмного забезпечення. У другому розділі на основі моделей машинного навчання розроблено методи відбору ключових ознак, що визначають зміну показників продуктивності вебзастосунків різної архітектури, які поєднують структурні, кореляційні та контекстно-адаптивні підходи до відбору ключових ознак продуктивності. Запропоновано графово-орієнтований метод визначення найважливіших ознак продуктивності, багатофакторну модель злиття телеметрії, а також спеціалізовані процедури для безсерверних та хмарних архітектур з динамічним масштабуванням. Запропоновані методи забезпечують пояснюваність аналізу завдяки SHAP-подібним індикаторам впливу ознак та дозволяють формувати інтерпретовані гіпотези щодо можливих причин деградації продуктивності вебсистем, формуючи основу для інтелектуального вибору архітектурних рішень. У третьому розділі проведено експериментальну перевірку запропонованих методів, включно з побудовою датасетів, навчанням моделей та їх валідацією на синтетичних та реальних телеметричних даних. Виконано порівняльний аналіз точності класифікації архітектур вебзастосунків, досліджено якість відбору ключових ознак, а також оцінено масштабованість та стійкість запропонованих моделей у сценаріях зростання навантаження. Додатково реалізовано інтерпретацію результатів за допомогою методів SHAP та LIME, що забезпечило інтерпретацію прогнозів та додаткову перевірку узгодженості виявлених статистичних залежностей. Для формування бази даних було здійснено збір телеметричної інформації, який об’єднав реальні дані з промислових систем та синтетично змодельовані сценарії навантаження. Дані отримувалися з корпоративних середовищ Kubernetes, AWS Lambda, Google Cloud Run та Azure App Services з використанням систем Prometheus, OpenTelemetry Collector та Jaeger. Процес навчання моделей машинного навчання реалізовувався в єдиному експериментальному середовищі на базі бібліотек PyTorch Lightning, MLflow та Spark ML. Отримані результати свідчать про наукову обґрунтованість та практичну доцільність застосування розроблених методів у досліджуваних умовах. У четвертому розділі розроблено архітектуру ПЗ для інтелектуального аналізу продуктивності вебзастосунків, яка поєднує модулі збору телеметрії, обробки даних, прогнозування, пояснюваного машинного навчання та надання рекомендацій веброзробникам. Запропоновано архітектурний шаблон, що автоматизує вибір архітектурного стилю за ознаками продуктивності. Розроблено вебінтерфейс та REST API для інтерактивної роботи з показниками продуктивності, трасуваннями та SHAP-поясненнями. Запропонована архітектура підтримує контейнеризоване розгортання, інтеграцію з інфраструктурою моніторингу та демонструє переваги щодо енергоефективності, точності рекомендацій та використання ресурсів. Наведено експериментальні дослідження аналізу вебзастосунків різної архітектури та порівняння розробленого програмного забезпечення з наявними рішеннями. У дисертаційній роботі отримано низку нових наукових результатів. Уперше запропоновано топологічно-орієнтований метод відбору ознак TAM-GNN, який, на відміну від класичних статистичних методів, враховує структурну взаємозалежність компонентів вебзастосунку за допомогою графових нейронних мереж GNN, що забезпечує підвищення точності виявлення критичних зон деградації продуктивності вебзастосунків у середньому на 27 %. Уперше розроблено кореляційно-графовий метод DCA-MicroNet, що, на відміну від класичних кореляційних методів, використовує графові нейронні мережі з механізмом уваги, SHAP-інтерпретації та пояснюваний аналіз міжсервісних залежностей, що дозволяє скоротити час локалізації «вузького місця» в мікросервісних вебзастосунках у середньому на 37 % Уперше запропоновано контекстно-адаптивний метод CMA-CloudNet, що, на відміну від статичних методів відбору ознак, поєднує механізми навчання з підкріпленням та контекстну адаптацію, що дозволяє зменшити час реакції системи аналізу продуктивності хмарних вебзастосунків у середньому на 27 %. Удосконалено багатофакторну модель злиття показників продуктивності AMF-MonoNet, яка, на відміну від традиційних моделей, поєднує PCA, LASSOрегуляризацію та аналіз взаємної інформації, забезпечуючи формування ортогоналізованого ядра ознак для монолітних вебсистем, що уможливлює зменшення середньої абсолютної похибки оцінювання часу відгуку монолітних вебзастосунків в середньому на 28 %. Розроблені методи та програмне забезпечення надають можливість автоматизованого аналізу продуктивності вебзастосунків з урахуванням архітектури системи та динаміки навантаження. Запропоноване програмне забезпечення дозволяє веброзробникам оперативно виявляти «вузькі місця» та оптимізувати роботу вебсервісів. Розроблене програмне забезпечення, на відміну від промислових APM-платформ, знижує використання CPU, RAM та енергоспоживання. Запропонована модель формування рекомендацій, на відміну від шаблонних порад у класичних моніторингових системах, враховує внесок кожної ознаки, ефект конкретної дії та підвищує релевантність рекомендацій. Запропонований архітектурний шаблон Adaptive Architectural Selection Pattern, на відміну від статичних APM-рішень, дозволяє автоматично адаптуватися до архітектурного класу вебзастосунку, забезпечуючи скорочення часу діагностики інцидентів. Запропонований метод CEA-ServerlessNet, на відміну від традиційного суцільного моніторингу, використовує багатокритеріальну та Байєсівську оптимізацію для адаптивного визначення частоти збору показників з урахуванням «холодних стартів», часу виклику функцій та вартості виконання обчислень, що дозволяє зменшити середню похибку оцінювання часу відгуку приблизно на 43 %. У дисертаційній роботі вирішене наукове завдання підвищення точності виявлення ключових ознак, що впливають на результати аналізу продуктивності вебзастосунків різної архітектури та зменшення споживання ресурсів під час експлуатації цифрових систем. Досягнуті результати забезпечують автоматизоване виявлення критичних аномалій, формування рекомендацій для веброзробників та зниження ресурсоспоживання під час моніторингу, що є особливо важливим у контексті використання цифрової інфраструктури України в умовах обмежених енергетичних ресурсів. Програмна реалізація запропонованих у дисертації методів може бути інтегрована в середовища DevOps та CI/CD, що дозволить підвищувати ефективність процесів розроблення, тестування та експлуатації вебзастосунків. Основні наукові результати дисертаційної роботи опубліковано у 9 наукових працях, зокрема, у 4 наукових статтях, опублікованих у фахових виданнях, включених до переліку наукових фахових видань України з присвоєнням категорії «Б», та у 5 матеріалах науково-технічних конференцій.

Ключові слова

інженерія програмного забезпечення, архітектура програмного забезпечення, архітектурні рішення, продуктивність вебзастосунків, попередня обробка даних, граф, машинне навчання, оптимізація, нейронна мережа, моніторинг, системи моніторингу, прогнозування, метрики продуктивності, програмування, software engineering, software architecture, architectural solutions, web application performance, data preprocessing, graph, machine learning, optimization, neural network, monitoring, monitoring systems, prediction, performance metrics, programming

Бібліографічний опис

Бурчак, П. В. Методи та програмне забезпечення для аналізу продуктивності вебзастосунків на основі моделей машинного навчання : дис. ... д-ра філософії : 121 Інженерія програмного забезпечення / Бурчак Павло Володимирович. - Київ, 2026. - 210 с.

URI

https://ela.kpi.ua/handle/123456789/80749

Зібрання

Дисертації (ПЗКС)
Дисертації (вільний доступ)

Повна інформація про документ

Методи та програмне забезпечення для аналізу продуктивності вебзастосунків на основі моделей машинного навчання

Файли

Дата

Автори

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Опис

Ключові слова

Бібліографічний опис

ORCID

URI

DOI

Зібрання