Керування за прогнозною моделлю у лінійних дискретних системах

dc.contributor.advisorГубарев, Вячеслав Федорович
dc.contributor.authorМіщенко, Михайло Дмитрович
dc.date.accessioned2024-06-18T07:23:43Z
dc.date.available2024-06-18T07:23:43Z
dc.date.issued2024
dc.description.abstractМіщенко М. Д. Керування за прогнозною моделлю у лінійних дискретних системах. — Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 01.05.04 «Системний аналіз і теорія оптимальних рішень» (124 — Системний аналіз). — Національного технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2024. Метою дисертаційного дослідження є реалізація термінального керування, яке б виконувало завдання стабілізації. Існує широкий спектр як технічних, так й інших різновидів систем, які можуть бути достатньо точно змодельовані як лінійні системи, що функціонують у дискретному часі (ЛСДЧ). Ця математична модель часто застосовується в інженерії, але також може бути використана в багатьох інших сферах. Завдання стабілізації систем такого типу є досить поширеним. Для стабілізації ЛСДЧ традиційно застосовують методи, розроблені на основі теорії керування, математичний апарат якої тривалий час був невід’ємним у розв’язанні цього завдання. Хоча важливість зазначеного підходу важко переоцінити, тривала історія досліджень у цьому напрямі показала деякі недоліки, які можуть у різні способи заважати ефективній стабілізації. Зокрема, якщо йдеться про керування недетерміністичними системами, математичний апарат теорії керування примушує підлаштовувати алгоритми під деякі наперед задані припущення про статистичні властивості збурень, що діють на систему. Він також не дозволяє включити обмеження на величини сигналів керування в модель системи. Через це інженери змушені вручну підлаштовувати параметри контролера в кожному випадку окремо, аби задовольнити ці обмеження. Дослідження присвячено розробленню альтернативних алгоритмів стабілізації ЛСДЧ на основі підходу керування за прогнозною моделлю (КПМ). Він полягає в генеруванні сигналів керування шляхом вибору тієї послідовності сигналів, яка відповідає найкращому (за певним критерієм) прогнозу траєкторії стану системи на обмеженому горизонті. На практиці це здійснюється за допомогою розв’язання завдання оптимізації, цільова функція якого залежить від прогнозованого майбутнього стану. Застосування методів оптимізації замість математичного апарату на основі перетворення Лорана дозволяє уникнути потреби ручного доналагодження алгоритму. Це також дозволяє генерувати швидкі стабілізаційні траєкторії за рахунок використання еволюційного рівняння для ЛСДЧ як предиктора майбутнього стану у складі цільової функції, а обмежень на керування — як обмежень завдання оптимізації. У результаті дослідження отримано новий клас методів, здатних до термінального стабілізаційного керування. Інакше кажучи, вони здатні приводити стан лінійної системи до нуля (або в разі наявності збурень — до його околу) за скінченний час й утримувати його там надалі. Вони можуть стабілізувати не тільки строго стійкі системами, а й напівстійкі та нестійкі, зокрема й в умовах наявності випадкових збурень та з урахуванням обмеженості ресурсу керування. Ці методи можна застосовувати для керування як технічними, так і будь-якими іншими системами, які описуються у формі ЛСДЧ. Однак цей підхід потребує дещо більшої кількості обчислень. Для ефективного застосування наявного ресурсу керування (заданого у формі обмежень на сигнали керування) здебільшого необхідна велика довжина горизонту прогнозування, що призводить до зростання необхідної кількості обчислювальних ресурсів. Попри це, завдяки суттєвому прогресові в обчислювальній потужності комп’ютерів з появою теорії керування стало можливим практичне застосування таких алгоритмів. Водночас обмеження в обчислювальних ресурсах все ще існують і можуть виявитися критичними. Тому на практиці оптимізувати наслідки майбутньої послідовності керувань можливо лише на горизонтах обмеженої довжини. Внаслідок цього неабияк важливо розуміти, як таке обмеження впливає на якість керування. Для візуалізації динаміки стабілізації систем у роботі запропоновано застосовувати теплові карти індексів, які характеризують цей процес. На таких теплових картах зображається залежність цих індексів від початкового стану системи. Таке представлення дозволяє наочно побачити, як на динаміку впливають обмеження горизонту прогнозування і, власне, структура самої системи. Такі теплові карти було побудовано для кількох визначних прикладів систем із різними структурами шляхом виконання відповідних обчислювальних експериментів. Результати цих експериментів показують, що втрати від обмеження довжини горизонту прогнозування варіюються від значних до повної їх відсутності залежно від структури системи та обраного для представлення системи базису простору станів. Ці втрати зменшуються, якщо збільшити межу довжини прогнозного горизонту. Проста цільова функція, що мінімізує норму майбутнього стану, дає найкращі результати для таких систем, чия матриця залежності наступного стану від попереднього є діагоналізовна над полем комплексних чисел і подана в дійсній Жордановій формі. В іншому разі результати сильно погіршуються. У зв’язку із цим у роботі зроблено висновок, що динаміка стабілізації суттєво залежить від структури системи та обраного базису простору станів. Вдале представлення системи може в частині випадків компенсувати обмеження на довжину горизонту прогнозування. Проте загалом це потребує особливим способом сконструйованої цільової функції. Для деяких систем в умовах обмеженості горизонту прогнозування особлива її конструкція стає критично необхідною, аби цей алгоритм належно працював. Як виявилося, задати цільову функцію з достатньо добрими властивостями є нетривіальним завданням. У цій роботі застосовано сучасний нестандартний аналіз для конструювання вдалої цільової функції на основі структури ЛСДЧ. Під час цього дослідження з’ясувалося, що застосування принципу КПМ до стабілізації недетерміністичної ЛСДЧ потребує значної уваги стосовно того, як саме застосовуються до неї згенеровані керування. Виявилося, що некоректна схема застосування керувань призводить до безлічі неочевидних і небажаних ефектів. У цій роботі було почергово обговорено, пояснено й на прикладах продемонстровано вищезазначені ефекти. Аналіз їхніх причин дозволив виявити вимоги до алгоритму керування за прогнозною моделлю, виконання яких забезпечить надійність його роботи. Також з’ясувалося, що здебільшого оптимальна стабілізаційна траєкторія не є унікальною, тобто, можливо обирати між оптимальними траєкторіями заради покращення якогось другорядного показника. До того ж, як приклад, який є цінним сам собою, у роботі окремо розглянуто стабілізацію імпульсів у лінійних когнітивних картах. Будучи прикладами лінійних систем у дискретному часі, лінійні когнітивні карти допускають застосування щодо їх імпульсів тих самих стратегій та алгоритмів керування. Але якщо опустити природу когнітивних карт, їхній стан починає поступово змінюватися в непередбачуваному напрямку під тиском зовнішніх випадкових збурень (шуму) попри те, що стабілізуючий контролер придушує їх вплив на імпульси когнітивної карти. Здатність підходу керування за прогнозною моделлю враховувати другорядні цілі дозволила усунути цей ефект принаймні частково шляхом цілеспрямованої стабілізації когнітивної карти біля деякого наперед обраного стану. Також у роботі продемонстровано, що з усього простору станів когнітивної карти лише деяка гіперплощина в ній є досяжною одночасно зі стабілізацією імпульсів. Розроблений метод призначений для керування системою, стан якої повністю вимірюваний. Проте керування системою, стан якої не є спостережним безпосередньо, є поширеним завданням. Натомість зазвичай наявні непрямі, неповні та зашумлені вимірювання стану. У таких випадках фільтр Калмана є загальноприйнятим і класичним підходом до оцінки стану лінійних систем за непрямими вимірюваннями. Він рекурсивний і тому опосередковано враховує всю історію вимірювань. У роботі досліджено альтернативний підхід: виконувати оцінку на основі вимірювань на обмеженому історичному горизонті. Тож спочатку обговорюється застосування узагальненого методу найменших квадратів (УМНК) щодо цього завдання, а також умови, за яких доцільно застосовувати цей метод. Для випадків, коли він не підходить, у роботі запропоновано спосіб представлення оцінювача за УМНК як завдання квадратичного програмування на конусі, що дає змогу створювати його модифікації, підлаштовані під різноманітні нестандартні конструкції лінійних систем. У роботі також досліджено різні властивості й поведінку оцінювача, побудованого за УМНК та модифікаціями цього методу. Зокрема, цілком очікуваним є те, що оцінювачі демонструють різну точність за різної кількості використаних вимірювань. Тому було досліджено застосування абсолютного числа обумовленості оцінювача на базі УМНК до вибору оптимальної довжини горизонту. Також продемонстровано, як абсолютне число обумовленості, будучи жорстким обмеженням точності оцінювання, обмежує й математичне сподівання норми помилки. Вибір найкращої довжини горизонту було описано з обох цих поглядів. Для ситуацій, коли найкраща можлива точність оцінювання все ще не є достатньою, у роботі запропоновано метод регуляризації. Досліджено його переваги та недоліки, а також те, як робити поінформований вибір стосовно ступеня регуляризації. Теоретичні результати щодо оцінювачів перевірено шляхом обчислювальних експериментів.
dc.description.abstractotherMishchenko M. D. Model predictive control in linear discree systems. - Qualifying scientific work. Manuscript. Thesis for a Doctor of Philosophy degree in specialty 01.05.04 “System analysis and theory of optimal solutions” (124 — System analysis). — National Technical University of Ukraine “Igor Sikorsky Kyiv Polytechnic Institute”, 2024. The aim of the dissertation research is to develop a terminal control process intended for system stabilization. Various technical and other real-world systems can be modelled with decent precision as discrete-time linear systems. This approach is the core of the long established control theory, whose mathematical apparatus is ubiquitous when it comes to controlling some kind of system. This mathematical model is often used in engineering, but also can be used in many other fiels. The problem of stabilization of this kind of system frequently arises. Control thory based methods application has become traditional for system stabilization. The mathematical aparatus of the control theory has already been indispensible in solving this problem for a long time. While it is hard to underestimate importance of this approach, long history of research in this field showed some of its shortcomings which may hinder its application in various ways. In particular, algorithms based on the mathematical aparatus of the control theory are deeply tied to some predetermined hypothesis about random perturbation’s probability distribution. It also does not allow to incorporate constraints on control signal’s magnitude into the system’s model. Thus, engineers are forced to manually tune controller’s parameters ad-hoc in order to satisfy these constraints. The research is dedicated to development of alternative model predictive control (MPC) based stabilization algorithms for discrete-time linear systems. The core idea of the MPC is to generate control signals by choosing a control sequence which corresponds to the best (by some criterion) trajectory prediction on a limited horizon. In practice, it is done by solving an optimization problem, whose objective function depends on future state’s prediction. Usage of the mathematical optimization apparatus instead of the Z-transform allows to avoid ad-hoc controller tuning. It also allows to generate fast stabilization trajectories by using the classic linear system’s evolutionary equation as a future state predictor and constraints on controls as optimization problem’s constraints. A new kind of algorithms capable of terminal stabilization control emerged from results of this research. These algorithms are able to bring system’s state to zero (or at least into its neighborhood in nondeterministic case) in finite time and keep it there indefinitely. They can stabilize not only strictly stable systems, but also semi-stable and unstable ones while respecting control resource constraints. They are capable of it even if there are random perturbations affecting the system. These methods are applicable to controlling technical and any other systems describable in linear discrete-time form. The drawback is that this approach requires somewhat bigger amount of computations. In most cases effective utilization of control resources (defined by control signal constraints) requires a large prediction horizon, which leads to increase in computational resource requirements. Nevertheless, considerable progress in computational power since the control theory emergence gave an opportunity of employing these algorithms in practice. At the same time, constraints on computational resources still exist and may become critial. Thus, in practice, optimization of future control sequence consequences can only be performed for limited prediction horizons. That is why it became important to understand how this constraint affects control quality. In order to visualize system stabilization dynamics it is proposed here to use heat maps of indexes characterizing this process. This computation experiment based representation allows us to clearly see how the stabilization dynamics is affected by horizon length limiting and how it differs for systems with different structure. Such heatmaps were built for several prominent example systems with different structures by performing corresponding series of computational experiments. It is apparent from these experiment results, that deficiencies induced by limited prediction horizon length vary from significant to their complete absence depending on the system’s structure and choosen state space basis. These deficiencies lessen with increase of horizon length. Simple objective function which minimizes future states’ norm gives best results for systems whose state-transition matrix is diagonalizable on complex field and is presented in the real Jordan normal form. Otherwise results significantly worsen. From these results it is concluded that stabilization dynamics significantly depends on system’s structure and choosen basis of state space. A good system representation can in some cases compensate drawbacks caused by limited horizon length. But in general it requires a custom-constructed objective function. For some systems it is crucial for proper algorithm operation to have the right objective function in situation with limited horizon length. As it turned out, it is a nontrivial task to define an objective function with good properties. Modern nonstandard analysis is applied in this work in order to construct an objective function, which is based on system’s structure. During this research it turned out that application of the MPC principles on stabilization of nondeterministic linear discrete-time system requires great care regarding how exactly the generated controls are applied to system. It appeared that incorrect application of generated control sequences leads to many unobvious and undesirable effects. These effects are discussed, explained and demonstrated one by one on examples in this work. Analysis of their causes reveals requirements for MPC-based stabilizing control algorithm which allow resulting controller to operate reliably. It also appears that in most cases an optimal stabilization trajectory is not unique, i.e. it is possible to choose between optimal trajectories to improve some kind of secondary objective. In addition, as an example which is valuable by itself, stabilization in linear cognitive maps is discussed separately. Being an example of discrete-time linear system, linear cognitive maps are susceptible of application of the same control strategies and algorithms to their impulses. But if nature of linear cognitive map is disregarded, their state starts to wander under pressure of external random perturbation (i.e. noise) even though stabilizing controller mitigates their influence on cognitive map’s impulses. Ability of the MPC approach to consider secondary objectives allowed to mitigate this effect at least partially. In particular, it is achieved here by seeking a particular objective cognitive map state as a secondary objective in search for a stabilization trajectory. It is also demonstrated here that only a certain hyperplane in cognitive map’s state-space is reachable under assumption, that its impulse is zero at the end of trajectory. The developed control method is intended for systems whose state is fully measurable. But it is often required for systems whose state is not observable directly. Instead, there are indirect, incomplete and noised measurements of its state. In such situation it is required to estimate current system’s state from these indirect measurements first in order to control the system. For this purpose the Kalman filter is a long established and classical approach on estimation of linear system’s state from indirect measurements. It is recursive by desin, and thus indirectly takes into account the whole previous history of measurements. An alternative approach is explored here: estimation with measurements on a limited historic horizon. The work first discusses application of the generalized linear least squares (GLLS) estimator to this problem and conditions under which it is appropriate to use this method. For situations when it is not fully appropriate, the work proposes a way to represent the GLLS estimator as a quadratic cone programming problem, which helps producing its modifications tuned for various nonstandard linear system designs. The work also explores various properties and behavior of the GLLS estimator and its modifications. For instance, it is completely expectable that such estimators demonstrate diferent precision with different number of historic measurements considered. Thus, application of the absolute condition number of the GLLS estimator to choosing an optimal horizon length was explored. It was demonstrated how the absolute condition number of GLLS, while being a hard limit on estimation precision, also limits expected value of error norm. Choice of the best horizon length was discussed from both of these points of view. For situations when best possible estimation precision is still not enough, a regularization method was proposed. Pros and cons of this regularization method and a way to make an informed choice regarding the degree of regularization was explored. The theoretical results were confirmed with computational experiments.
dc.format.extent191 с.
dc.identifier.citationМіщенко, М. Д. Керування за прогнозною моделлю у лінійних дискретних системах : дис. … д-ра філософії : 124 Системний аналіз / Міщенко Михайло Дмитрович. – Київ, 2024. – 191 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/67216
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectваріаційний метод
dc.subjectгіпердійсні числа
dc.subjectгіпердійснозначна цільова функція
dc.subjectдискретний час
dc.subjectімпульсний процес у когнітивній карті
dc.subjectквадратичне програмування
dc.subjectкерування за прогнозною моделлю
dc.subjectковзний інтервал
dc.subjectкогнітивна карта
dc.subjectлінійна система
dc.subjectлінійна когнітивна карта
dc.subjectметод найменших квадратів
dc.subjectнестандартний аналіз
dc.subjectобмеження
dc.subjectобмежений історичний горизонт вимірювань
dc.subjectоптимізація
dc.subjectоцінка стану
dc.subjectрухомий горизонт
dc.subjectсинтез керування
dc.subjectсистема з багатьма змінними та входами
dc.subjectстабілізація
dc.subjectтеплова карта
dc.subjectцілеспрямована стабілізація
dc.subjectaimed stabilization
dc.subjectcognitive map
dc.subjectconstraints
dc.subjectcontrol synthesis
dc.subjectdiscrete controllable system
dc.subjectdiscrete time
dc.subjectheatmap
dc.subjecthyperreal numbers
dc.subjecthyperreals
dc.subjecthyperreal valued objective function
dc.subjectimpulse process
dc.subjectlimited measurement historic horizon
dc.subjectlinear discrete systems
dc.subjectlinear least squares
dc.subjectlinear system
dc.subjectMIMO system
dc.subjectMIMV system
dc.subjectmodel predictive control (MPC)
dc.subjectmoving horizon
dc.subjectnon-standard analysis
dc.subjectoptimization
dc.subjectquadratic cone programming
dc.subjectstabilization
dc.subjectstate estimation
dc.subjectvariational method
dc.subject.udc519.688 +[[681.5.015.4::519.85] :681.51] +[519.853-049.8 :[681.513.52:681.513.54]] +[519.85::[517+511]]
dc.titleКерування за прогнозною моделлю у лінійних дискретних системах
dc.typeThesis Doctoral

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Mishchenko_dys.pdf
Розмір:
3.74 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: