Керування за прогнозною моделлю у лінійних дискретних системах
Вантажиться...
Дата
2024
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Міщенко М. Д. Керування за прогнозною моделлю у лінійних дискретних системах. — Кваліфікаційна наукова праця на правах рукопису.
Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 01.05.04 «Системний аналіз і теорія оптимальних рішень» (124 — Системний аналіз). — Національного технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2024.
Метою дисертаційного дослідження є реалізація термінального керування, яке б виконувало завдання стабілізації. Існує широкий спектр як технічних, так й інших різновидів систем, які можуть бути достатньо точно змодельовані як лінійні системи, що функціонують у дискретному часі (ЛСДЧ). Ця математична модель часто застосовується в інженерії, але також може бути використана в багатьох інших сферах. Завдання стабілізації систем такого типу є досить поширеним. Для стабілізації ЛСДЧ традиційно застосовують методи, розроблені на основі теорії керування, математичний апарат якої тривалий час був невід’ємним у розв’язанні цього завдання. Хоча важливість зазначеного підходу важко переоцінити, тривала історія досліджень у цьому напрямі показала деякі недоліки, які можуть у різні способи заважати ефективній стабілізації. Зокрема, якщо йдеться про керування недетерміністичними системами, математичний апарат теорії керування примушує підлаштовувати алгоритми під деякі наперед задані припущення про статистичні властивості збурень, що діють на систему. Він також не дозволяє включити обмеження на величини сигналів керування в модель системи. Через це інженери змушені вручну підлаштовувати параметри контролера в кожному випадку окремо, аби задовольнити ці обмеження. Дослідження присвячено розробленню альтернативних алгоритмів стабілізації ЛСДЧ на основі підходу керування за прогнозною моделлю (КПМ). Він полягає в генеруванні сигналів керування шляхом вибору тієї послідовності сигналів, яка відповідає найкращому (за певним критерієм) прогнозу траєкторії стану системи на обмеженому горизонті. На практиці це здійснюється за допомогою розв’язання завдання оптимізації, цільова функція якого залежить від прогнозованого майбутнього стану. Застосування методів оптимізації замість математичного апарату на основі перетворення Лорана дозволяє уникнути потреби ручного доналагодження алгоритму. Це також дозволяє генерувати швидкі стабілізаційні траєкторії за рахунок використання еволюційного рівняння для ЛСДЧ як предиктора майбутнього стану у складі цільової функції, а обмежень на керування — як обмежень завдання оптимізації. У результаті дослідження отримано новий клас методів, здатних до термінального стабілізаційного керування. Інакше кажучи, вони здатні приводити стан лінійної системи до нуля (або в разі наявності збурень — до його околу) за скінченний час й утримувати його там надалі. Вони можуть стабілізувати не тільки строго стійкі системами, а й напівстійкі та нестійкі, зокрема й в умовах наявності випадкових збурень та з урахуванням обмеженості ресурсу керування. Ці методи можна застосовувати для керування як технічними, так і будь-якими іншими системами, які описуються у формі ЛСДЧ. Однак цей підхід потребує дещо більшої кількості обчислень. Для ефективного застосування наявного ресурсу керування (заданого у формі обмежень на сигнали керування) здебільшого необхідна велика довжина горизонту прогнозування, що призводить до зростання необхідної кількості обчислювальних ресурсів. Попри це, завдяки суттєвому прогресові в обчислювальній потужності комп’ютерів з появою теорії керування стало можливим практичне застосування таких алгоритмів. Водночас обмеження в обчислювальних ресурсах все ще існують і можуть виявитися критичними. Тому на практиці оптимізувати наслідки майбутньої послідовності керувань можливо лише на горизонтах обмеженої довжини. Внаслідок цього неабияк важливо розуміти, як таке обмеження впливає на якість керування. Для візуалізації динаміки стабілізації систем у роботі запропоновано застосовувати теплові карти індексів, які характеризують цей процес. На таких теплових картах зображається залежність цих індексів від початкового стану системи. Таке представлення дозволяє наочно побачити, як на динаміку впливають обмеження горизонту прогнозування і, власне, структура самої системи. Такі теплові карти було побудовано для кількох визначних прикладів систем із різними структурами шляхом виконання відповідних обчислювальних експериментів. Результати цих експериментів показують, що втрати від обмеження довжини горизонту прогнозування варіюються від значних до повної їх відсутності залежно від структури системи та обраного для представлення системи базису простору станів. Ці втрати зменшуються, якщо збільшити межу довжини прогнозного горизонту. Проста цільова функція, що мінімізує норму майбутнього стану, дає найкращі результати для таких систем, чия матриця залежності наступного стану від попереднього є діагоналізовна над полем комплексних чисел і подана в дійсній Жордановій формі. В іншому разі результати сильно погіршуються. У зв’язку із цим у роботі зроблено висновок, що динаміка стабілізації суттєво залежить від структури системи та обраного базису простору станів. Вдале представлення системи може в частині випадків компенсувати обмеження на довжину горизонту прогнозування. Проте загалом це потребує особливим способом сконструйованої цільової функції. Для деяких систем в умовах обмеженості горизонту прогнозування особлива її конструкція стає критично необхідною, аби цей алгоритм належно працював. Як виявилося, задати цільову функцію з достатньо добрими властивостями є нетривіальним завданням. У цій роботі застосовано сучасний нестандартний аналіз для конструювання вдалої цільової функції на основі структури ЛСДЧ. Під час цього дослідження з’ясувалося, що застосування принципу КПМ до стабілізації недетерміністичної ЛСДЧ потребує значної уваги стосовно того, як саме застосовуються до неї згенеровані керування. Виявилося, що некоректна схема застосування керувань призводить до безлічі неочевидних і небажаних ефектів. У цій роботі було почергово обговорено, пояснено й на прикладах продемонстровано вищезазначені ефекти. Аналіз їхніх причин дозволив виявити вимоги до алгоритму керування за прогнозною моделлю, виконання яких забезпечить надійність його роботи. Також з’ясувалося, що здебільшого оптимальна стабілізаційна траєкторія не є унікальною, тобто, можливо обирати між оптимальними траєкторіями заради покращення якогось другорядного показника. До того ж, як приклад, який є цінним сам собою, у роботі окремо розглянуто стабілізацію імпульсів у лінійних когнітивних картах. Будучи прикладами лінійних систем у дискретному часі, лінійні когнітивні карти допускають застосування щодо їх імпульсів тих самих стратегій та алгоритмів керування. Але якщо опустити природу когнітивних карт, їхній стан починає поступово змінюватися в непередбачуваному напрямку під тиском зовнішніх випадкових збурень (шуму) попри те, що стабілізуючий контролер придушує їх вплив на імпульси когнітивної карти. Здатність підходу керування за прогнозною моделлю враховувати другорядні цілі дозволила усунути цей ефект принаймні частково шляхом цілеспрямованої стабілізації когнітивної карти біля деякого наперед обраного стану. Також у роботі продемонстровано, що з усього простору станів когнітивної карти лише деяка гіперплощина в ній є досяжною одночасно зі стабілізацією імпульсів. Розроблений метод призначений для керування системою, стан якої повністю вимірюваний. Проте керування системою, стан якої не є спостережним безпосередньо, є поширеним завданням. Натомість зазвичай наявні непрямі, неповні та зашумлені вимірювання стану. У таких випадках фільтр Калмана є загальноприйнятим і класичним підходом до оцінки стану лінійних систем за непрямими вимірюваннями. Він рекурсивний і тому опосередковано враховує всю історію вимірювань. У роботі досліджено альтернативний підхід: виконувати оцінку на основі вимірювань на обмеженому історичному горизонті. Тож спочатку обговорюється застосування узагальненого методу найменших квадратів (УМНК) щодо цього завдання, а також умови, за яких доцільно застосовувати цей метод. Для випадків, коли він не підходить, у роботі запропоновано спосіб представлення оцінювача за УМНК як завдання квадратичного програмування на конусі, що дає змогу створювати його модифікації, підлаштовані під різноманітні нестандартні конструкції лінійних систем. У роботі також досліджено різні властивості й поведінку оцінювача, побудованого за УМНК та модифікаціями цього методу. Зокрема, цілком очікуваним є те, що оцінювачі демонструють різну точність за різної кількості використаних вимірювань. Тому було досліджено застосування абсолютного числа обумовленості оцінювача на базі УМНК до вибору оптимальної довжини горизонту. Також продемонстровано, як абсолютне число обумовленості, будучи жорстким обмеженням точності оцінювання, обмежує й математичне сподівання норми помилки. Вибір найкращої довжини горизонту було описано з обох цих поглядів. Для ситуацій, коли найкраща можлива точність оцінювання все ще не є достатньою, у роботі запропоновано метод регуляризації. Досліджено його переваги та недоліки, а також те, як робити поінформований вибір стосовно ступеня регуляризації. Теоретичні результати щодо оцінювачів перевірено шляхом обчислювальних експериментів.
Опис
Ключові слова
варіаційний метод, гіпердійсні числа, гіпердійснозначна цільова функція, дискретний час, імпульсний процес у когнітивній карті, квадратичне програмування, керування за прогнозною моделлю, ковзний інтервал, когнітивна карта, лінійна система, лінійна когнітивна карта, метод найменших квадратів, нестандартний аналіз, обмеження, обмежений історичний горизонт вимірювань, оптимізація, оцінка стану, рухомий горизонт, синтез керування, система з багатьма змінними та входами, стабілізація, теплова карта, цілеспрямована стабілізація, aimed stabilization, cognitive map, constraints, control synthesis, discrete controllable system, discrete time, heatmap, hyperreal numbers, hyperreals, hyperreal valued objective function, impulse process, limited measurement historic horizon, linear discrete systems, linear least squares, linear system, MIMO system, MIMV system, model predictive control (MPC), moving horizon, non-standard analysis, optimization, quadratic cone programming, stabilization, state estimation, variational method
Бібліографічний опис
Міщенко, М. Д. Керування за прогнозною моделлю у лінійних дискретних системах : дис. … д-ра філософії : 124 Системний аналіз / Міщенко Михайло Дмитрович. – Київ, 2024. – 191 с.