Методи, моделі та засоби прогнозування навантаження на вебсервер
| dc.contributor.advisor | Терейковський, Ігор Анатолійович | |
| dc.contributor.author | Радченко, Костянтин Олександрович | |
| dc.date.accessioned | 2026-02-26T12:04:11Z | |
| dc.date.available | 2026-02-26T12:04:11Z | |
| dc.date.issued | 2025 | |
| dc.description.abstract | Радченко К.О. Методи, моделі та засоби прогнозування навантаження на вебсервер. – Кваліфікаційна праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії з галузі знань 12 Інформаційні технології за спеціальністю 123 Комп’ютерна інженерія. Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2025. Дисертація присвячена розв'язанню актуальної науково-практичної задачі підвищення ефективності процесу прогнозування навантаження на вебсервер. В результаті проведеного аналізу була визначена перспективність вдосконалення шаблонів нормальної поведінки вебсерверів шляхом впровадження в їх математичне забезпечення сучасних методів частотно-часового аналізу сигналів на базі теорії вейвлет-перетворень. Було досліджено методи прогнозування навантаження на вебсервер з використанням вейвлет-перетворень у поєднанні з нейронними мережами. Актуальність теми обумовлена необхідністю забезпечення стабільної роботи вебресурсів в умовах нестабільного трафіку та різких пікових навантажень. Проведено аналіз теоретичних основ вейвлет-аналізу, класифікацію базисних функцій і розроблено критерії оцінки їх ефективності в задачах часових рядів. Запропоновано інтегровану модель, в якій вейвлет-декомпозиція застосовується для попередньої обробки вхідного сигналу, що дозволяє виокремити значущі компоненти навантаження на різних рівнях масштабу. Розроблено методику вибору оптимального порядку вейвлет-декомпозиції, що забезпечує компроміс між глибиною аналізу та збереженням корисної інформації. На відміну від методів Фур’є, вейвлети дозволяють локалізувати характеристики сигналу як у часовій, так і у частотній області, що дає змогу виділяти тренди, піки навантаження, флуктуації та періодичні аномалії. Проте в поточному науковому дискурсі мало вивченими залишаються питання вибору оптимального вейвлет-базису для задач такого типу, побудови комбінованихмоделей, а також критеріїв оцінювання якості таких моделей у порівнянні з класичними підходами. У зв’язку з цим, мета даного дослідження полягає у підвищенні ефективності прогнозування навантаження на вебсервери шляхом розробки вейвлет-орієнтованих моделей і програмних засобів, а також демонстрації їх переваг у порівнянні з традиційними методами. Було виконано поглиблений аналіз та формалізацію завдання прогнозування навантаження на вебсервери загального призначення з урахуванням особливостей їхньої роботи в комп’ютерних мережах. У процесі дослідження було уточнено предметну область та визначено комплекс ключових експлуатаційних характеристик вебсервера, що мають безпосередній вплив на рівень його навантаження. До таких параметрів належать кількість запитів у черзі, середній час відповіді, швидкість обробки запитів та інші метрики, що відображають стан і продуктивність системи. Для формалізації цих характеристик запропоновано опис області працездатності вебсервера через множину контрольованих параметрів з чітко встановленими граничними значеннями. Вихід будь-якого параметра за межі допустимого діапазону розглядається як ознака перевантаження та потенційного погіршення якості обслуговування. На основі отриманих даних розроблено концептуальну модель прогнозування навантаження, яка описує взаємозв’язок між динамікою параметрів вебтрафіку та прогнозними оцінками майбутніх станів системи. Ключовою особливістю моделі є автоматичний вибір типу базисного вейвлету залежно від характеру вхідного сигналу, що дозволяє підвищити ефективність аналізу. Обґрунтовано застосування вейвлет-перетворень для багатомасштабного аналізу даних, який дає змогу одночасно виявляти довгострокові тенденції та короткочасні пікові зміни у вебтрафіку, що є критично важливим для своєчасного реагування на зміни навантаження. Методологія моделі передбачає використання процедур фільтрації та попередньої обробки даних перед виконанням прогнозування, що зменшує вплив шумів та випадкових коливань на точність результатів. Визначено критерії ефективності вибору типу базисного вейвлету: точність відтворення сигналу, швидкість обчислень та стійкість до завад. Запропонована концептуальна модель формує основу для побудови гібридних систем прогнозування, зокрема рішень на базі Wavelet+LSTM, здатних зменшити час аналізу вебтрафіку та підвищити точність прогнозів завдяки адаптивному вибору базису. Гнучкість моделі забезпечує її сумісність із наявними системами моніторингу та управління вебресурсами без необхідності суттєвих змін в архітектурі. поетапно реалізовано модель прогнозування навантаження на вебсервер, яка охоплює збір логів та метрик, їх попередню обробку, вейвлетдекомпозицію, моделювання та подальшу інтеграцію результатів у робоче середовище. Такий підхід дозволяє ефективно розділяти сигнал на трендові та коливальні компоненти, що підвищує точність прогнозування як довготривалих змін, так і короткочасних пікових навантажень. Концептуальна модель процесу прогнозування навантаження на вебсервер являє собою абстрактне подання процесу, яке описує основні сутності, взаємозв’язки та інформаційні потоки між компонентами системи прогнозування. У межах цієї моделі визначаються ключові етапи – збір даних із серверних логів, попередня обробка сигналів, вейвлет-декомпозиція, формування ознак, навчання прогнозувальної нейронної мережі та оцінювання точності. Концептуальна модель відображає логічну структуру процесу, дозволяючи зрозуміти що саме виконує система та як пов’язані її функціональні блоки. Запропонована інтегрована модель процесів прогнозування навантаження на вебсервер являє собою об’єднання функціональних, аналітичних і алгоритмічних компонентів у взаємопов’язаний повний цикл прогнозування – від збору даних до прийняття рішень. Інтегрована модель реалізує взаємодію модулів моніторингу, вейвлет-аналізу, нейромережевого прогнозування, оптимізації параметрів та візуалізації результатів. Вона забезпечує цілісну інтеграцію інформаційних, аналітичних і керувальних процесів у єдиному середовищі, що дає змогу точніше формувати прогнози вебтрафіку й автоматично адаптувати конфігурацію серверних ресурсів під змінні умови роботи вебсистеми. Прогнозування навантаження на вебсервер зазвичай розглядається як задача часових рядів, де майбутні значення метрик навантаження передбачаються наоснові історичних даних. Особливість цієї задачі полягає у високій динамічності середовища, сезонності запитів, наявності пікових навантажень та неочікуваних стрибків, зумовлених зовнішніми факторами. Застосування вейвлет-аналізу дало змогу покращити роботу з нестаціонарними часовими рядами, адже він забезпечує високу деталізацію у часово-частотному просторі. Поєднання статистичних методів із глибинними нейронними моделями дозволило отримати більш збалансовані результати та знизити похибку прогнозів. Порівняльний аналіз показав перевагу інтегрованої вейвлет-моделі над традиційними підходами, такими як ARIMA чи класичні нейромережі. Практична цінність моделі полягає у можливості завчасно виявляти перевантаження та запобігати їм завдяки автоматичному масштабуванню, оптимізації використання обчислювальних ресурсів та інтеграції з інструментами моніторингу. Розроблена модель може застосовуватись адміністраторами вебресурсів як у тестових середовищах для генерації синтетичних навантажень, так і у реальних умовах для підтримання стабільності роботи серверів, здатних підлаштовуватися під динаміку трафіку, у використанні більших наборів даних для навчання та в аналізі зовнішніх факторів (сезонність, рекламні кампанії, події). Це відкриває перспективи для ще більш точного прогнозування та гнучкого управління вебсерверами у змінному середовищі. Запропоновано метод визначення ефективного типу базисного вейвлету, що призначений для розробки шаблону нормальної поведінки. Для цього обґрунтовано ряд положень та перелік критеріїв ефективності, які дозволяють забезпечити вибір ефективного типу базисного вейвлету у відповідності до значимих вимог задачі розробки означеного шаблону. Суть методу визначення найефективнішого типу материнського вейвлету полягає в систематичному багатокритеріальному оцінюванні вейвлет-функцій з урахуванням їхніх математичних, спектральних і структурних властивостей щодо характеру досліджуваного сигналу навантаження вебсервера. Метод передбачає порівняння вейвлетів-кандидатів за рядом кількісних і якісних критеріїв, що відображають придатність вейвлету для часовочастотного аналізу трафіку. На основі результатів вибору оптимального базису також розроблено метод прогнозування навантаження на вебсервер, який поєднує вейвлет-декомпозицію з нейромережевим прогнозуванням. Застосування обраного материнського вейвлету забезпечує ефективне виділення трендових і високочастотних компонентів трафіку, що, у свою чергу, підвищує адаптивність моделі до змін середовища та знижує середньоквадратичну похибку прогнозу. Суть методу прогнозування навантаження на вебсервер полягає у використанні інтегрованого поєднання часово-частотного аналізу сигналу за допомогою вейвлет-перетворення з глибинним нейронним прогнозуванням, що дозволяє з високою точністю передбачати зміну інтенсивності вебзапитів і забезпечувати оптимальне використання обчислювальних ресурсів серверної інфраструктури. здійснено огляд основних підходів до оцінки показників навантаження вебсерверів, що зводиться до пошуку ефективного компромісу між вимогами до безпеки та ресурсами, необхідними для їхнього забезпечення. Аналіз експериментальних результатів підтверджує, що комбінування вейвлет-фільтрації з подальшим прогнозуванням дозволяє досягати прийнятної точності на різних часових масштабах, а також забезпечує наочну інтерпретацію динаміки навантаження, що важливо для оперативного та стратегічного управління ресурсами вебсерверу. Однією з ключових переваг розробленої системи є можливість автоматизованого підбору оптимального вейвлету без потреби у тривалих обчислювальних експериментах, що суттєво скорочує час побудови моделі та підвищує ефективність процесу прогнозування. | |
| dc.description.abstractother | Radchenko K.O. Methods, models and tools for predicting web server load. – Qualifying scientific work, the manuscript. Ph.D. thesis in the field of knowledge 12 Information technologies in a specialty 123 Computer engineering. – National Technical University of Ukraine “Igor Sikorsky Kyiv Polytechnic Institute”, Kyiv, 2025. The thesis is devoted to solving the current scientific and practical task of improving the efficiency of the process of web server load forecasting. As a result of the conducted analysis, the feasibility of enhancing normal-behavior patterns of web servers through the integration of modern time–frequency signal analysis methods based on wavelet transform theory into their mathematical support was identified. Methods for forecasting web server load using wavelet transforms in combination with neural networks were thoroughly examined. The relevance of the topic is driven by the need to ensure the stable operation of web resources under conditions of unstable traffic and sudden peak loads. A detailed analysis of the theoretical foundations of wavelet analysis was conducted, including a classification of basis functions and the development of criteria for evaluating their effectiveness in time series tasks. An integrated model was proposed in which wavelet decomposition is used for preprocessing the input signal, enabling the extraction of significant load components at different scale levels. A methodology for selecting the optimal order of wavelet decomposition was developed, ensuring a balance between the depth of analysis and the preservation of useful information. Unlike Fourier-based methods, wavelets allow for the localization of signal characteristics in both time and frequency domains, making it possible to identify trends, load spikes, fluctuations, and periodic anomalies. However, in current scientific discourse, issues related to selecting an optimal wavelet basis for such tasks, designing combined models, and defining evaluation criteria for comparing such models with classical approaches remain insufficiently studied. Therefore, the aim of this research is to enhance the effectiveness of web server load forecasting through the development of wavelet-oriented models and software tools, as well as to demonstrate their advantages over traditional methods. A detailed analysis and formalization of the task of forecasting the load on generalpurpose web servers was carried out, taking into account the specifics of their behavior within computer networks. The main emphasis was placed on developing a conceptual forecasting model, which became a logical continuation and specified the components and parameters necessary for the practical implementation of a forecasting system. During the research, the problem domain was refined and a set of key operational characteristics affecting the level of web server load was defined. These parameters include queue length, average response time, request processing speed, and other metrics that reflect system state and performance. To formalize these characteristics, the operational region of a web server was described as a set of controlled parameters with clearly defined boundary values. Any deviation of such parameters beyond the allowed range is considered an indicator of overload and potential service degradation. Based on the obtained data, a conceptual load-forecasting model was developed, describing the relationship between the dynamics of web traffic parameters and the predicted future states of the system. A key feature of the model is the automatic selection of a wavelet basis type depending on the characteristics of the input signal, which improves analysis efficiency. The use of wavelet transforms for multiscale data analysis was justified, as it enables the simultaneous detection of long-term trends and short-term peak changes in web traffic – a feature that is critically important for timely response to load fluctuations. The methodology includes filtering and preprocessing procedures prior to forecasting, which reduce the influence of noise and random fluctuations on prediction accuracy. Efficiency criteria for wavelet basis selection were defined: signal reconstruction accuracy, computational speed, and noise robustness. The obtained results are valuable for further research and practical applications. The proposed conceptual model forms the foundation for building hybrid forecasting systems, particularly Wavelet+LSTM-based solutions capable of reducing traffic-analysis time and improving forecast accuracy through adaptive basis selection. The flexibility of the model ensures compatibility with existing web-resource monitoring and management systems without requiring significant architectural changes. A step-bystep implementation of a web server load-forecasting model was carried out, covering log and metric collection, preprocessing, wavelet decomposition, modeling, and integration of results into the working environment. This approach effectively separates the signal into trend and oscillatory components, thus improving the accuracy of both long-term and short-term peak load forecasting. The conceptual model of the web server load-forecasting process represents an abstract depiction of the system, describing the core entities, relationships, and information flows between its components. The model defines the key stages: data collection from server logs, preprocessing, wavelet decomposition, feature generation, neural-network training, and accuracy evaluation. It reflects the logical structure of the process, allowing one to understand what the system performs and how its functional blocks interact. The proposed integrated forecasting model combines functional, analytical, and algorithmic components into a unified prediction cycle – from data collection to decisionmaking. The integrated model ensures the interaction of monitoring modules, wavelet analysis, neural-network forecasting, parameter optimization, and result visualization. It provides seamless integration of information, analytical, and control processes within a single environment, enabling more accurate traffic forecasts and automatic adaptation of server-resource configurations to changing operational conditions. Web server load forecasting is typically addressed as a time-series problem, where future metric values (number of requests, CPU usage, response latency, etc.) are predicted based on historical data. The complexity of this task stems from high environmental dynamics, request seasonality, peak loads, and unexpected spikes caused by external factors (e.g., marketing campaigns, system updates). Wavelet analysis enabled improved handling of nonstationary time series by providing high resolution in the time–frequency domain. Combining statistical methods with deep neural models resulted in more balanced outcomes and reduced prediction error. Comparative analysis demonstrated the superiority of the integrated wavelet-based model over traditional approaches such as ARIMA or classical neural networks. The practical value of the model lies in its ability to detect overloads in advance and prevent them through automatic scaling, resource optimization, and integration with monitoring tools. The developed model can be used by web-resource administrators both in testing environments for generating synthetic loads and under real conditions to ensure stable server operation capable of adapting to traffic dynamics, large training datasets, and external factors (seasonality, ad campaigns, events). This opens new prospects for more accurate forecasting and flexible web-server management in a dynamic environment. A method for determining the most effective wavelet basis type was proposed, intended for developing a normal-behavior pattern. A set of principles and efficiency criteria was justified to support the selection of an appropriate wavelet basis according to the requirements of the task. The essence of the method lies in systematic multi-criteria evaluation of wavelet functions with respect to the mathematical, spectral, and structural properties of the web-server load signal. The method involves comparing candidate wavelets (Daubechies, Symlet, Coiflet, Biorthogonal, Meyer, Haar, etc.) based on several quantitative and qualitative criteria reflecting their suitability for time–frequency analysis of web traffic. Based on the optimal basis selection results, a load-forecasting method was developed that combines wavelet decomposition with neural-network prediction. Using an appropriate mother wavelet enables effective extraction of trend and high-frequency components of traffic, improving model adaptability and reducing mean squared error. The essence of the proposed forecasting method is the integrated use of time– frequency analysis via wavelet transforms together with deep-learning-based prediction, enabling accurate estimation of incoming request intensity and ensuring optimal utilization of server computing resources. A review of the main approaches to evaluating web server load metrics was conducted, highlighting the need to balance security requirements and the computational resources necessary to maintain system performance. Analysis of the experimental results confirms that combining wavelet filtering with subsequent neural forecasting yields acceptable accuracy across multiple time scales, and also provides clear interpretability of load dynamics, which is essential for both operational and strategic resource management. One of the key advantages of the developed system is the capability for automated optimal wavelet selection without requiring extensive computational experiments, significantly reducing model-building time and improving forecasting efficiency. | |
| dc.format.extent | 296 с. | |
| dc.identifier.citation | Радченко, К. О. Методи, моделі та засоби прогнозування навантаження на вебсервер : дис. … д-ра філософії : 123 Комп’ютерна інженерія / Радченко Костянтин Олександрович. – Київ, 2025. – 296 с. | |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/79084 | |
| dc.language.iso | uk | |
| dc.publisher | КПІ ім. Ігоря Сікорського | |
| dc.publisher.place | Київ | |
| dc.subject | нейронна мережа | |
| dc.subject | дані | |
| dc.subject | вебсервер | |
| dc.subject | трафік | |
| dc.subject | навантаження | |
| dc.subject | моделювання | |
| dc.subject | метод | |
| dc.subject | прогнозування | |
| dc.subject | система | |
| dc.subject | тестування | |
| dc.subject | модульність | |
| dc.subject | цифровий двійник | |
| dc.subject | вимірювання | |
| dc.subject | корекція і контроль помилок | |
| dc.subject | neural network | |
| dc.subject | data | |
| dc.subject | web server | |
| dc.subject | traffic | |
| dc.subject | load | |
| dc.subject | modeling | |
| dc.subject | method | |
| dc.subject | forecasting | |
| dc.subject | system | |
| dc.subject | testing | |
| dc.subject | modularity | |
| dc.subject | digital twin | |
| dc.subject | measurement | |
| dc.subject | error correction and control | |
| dc.subject.udc | 004.75:004.94 | |
| dc.title | Методи, моделі та засоби прогнозування навантаження на вебсервер | |
| dc.title.alternative | Methods, models and tools for predicting web server load | |
| dc.type | Thesis Doctoral |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Radchenko_dys.pdf
- Розмір:
- 7.83 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: