Дисертації (ММСА)
Постійне посилання зібрання
У зібранні розміщено дисертації, які захищені працівниками кафедри.
Переглянути
Перегляд Дисертації (ММСА) за Ключові слова "004.8, 519.7"
Зараз показуємо 1 - 2 з 2
Результатів на сторінці
Налаштування сортування
Документ Відкритий доступ Адаптивне управління імпульсними процесами з різнотемповою дискретизацією в когнітивних картах застосування криптовалюти(КПІ ім. Ігоря Сікорського, 2025) Канцедал, Георгій Олегович; Романенко, Віктор ДемидовичКанцедал Г.О. Адаптивне управління імпульсними процесами з різнотемповою дискретизацією в когнітивних картах застосування криптовалюти. – Кваліфікаційна робота на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 01.05.04 «Системний аналіз і теорія оптимальних рішень» (124 – Системний аналіз). – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2025. У дисертаційній роботі розглянуто питання моделювання та управління нестабільним курсом криптовалюти з використанням когнітивних карт та імпульсних процесів. Дослідження проблеми волатильності криптовалют є надзвичайно актуальним для фінансових ринків, оскільки значні коливання курсу створюють ризики для інвесторів, трейдерів та фінансових установ. Відсутність централізованого регулювання та значна залежність курсу від соціально-економічних та спекулятивних факторів ускладнюють прогнозування та управління криптовалютними активами. Непередбачувані коливання можуть призводити до значних фінансових втрат, зниження довіри до цифрових активів та нестабільності ринку загалом. Для вирішення проблем породжених використанням криптовалют і аналізу майнингу, розроблені когнітивних карт для моделювання складних процесів взаємодії криптовалюти як інструменту обміну з різними явищами характерними для криптовалют та економічних ринків. Основна увага приділена створенню моделей імпульсних процесів у когнітивних картах з різнотемповою дискретизацією для управління курсом криптовалют зокрема його стабілізації. Було використано методи адаптивного управління для подолання недоліків використання криптовалют і стабілізації криптовалютних ринків. Метою дослідження є розробка математичних моделей та методів управління динамікою криптовалютного ринку з використанням когнітивних карт. Дослідження складається з п’яти розділів в яких детально проаналізовано впливу різних факторів на курс криптовалют, створено механізмів стабілізації вартості та зменшення ризиків при використанні криптовалют. Для цього проведено аналіз використання криптовалюти як складної системи, визначено основні невизначеності та ризики, що виникають у процесі її функціонування на фінансових ринках, розроблено когнітивну карту застосування криптовалют, яка моделює взаємозв’язки між ключовими економічними, соціальними та технологічними факторами; розроблено динамічні алгоритми ідентифікації вагових коефіцієнтів матриць суміжності для швидкозмінних та повільнозмінних масштабів часу, що забезпечує коректну адаптацію моделі до змінних ринкових умов; сформовано взаємопов’язані замкнені підсистеми керування з різнотемповою дискретизацією для швидкодіючої та повільнодіючої підсистем когнітивної карти, які забезпечують стабілізацію відповідних вершин на заданих рівнях; розроблено підсистеми динамічного керування для швидкодіючої підсистеми з механізмом координації вершин, що дозволяє забезпечити збалансоване управління криптовалютним ринком; проведено експериментальне дослідження побудованої імпульсної системи з різнотемповою дискретизацією, а також розроблених систем керування, підтверджено їхню ефективність у стабілізації криптовалютного курсу; виконано експериментальне дослідження алгоритмів ідентифікації швидкодіючої та повільнодіючої підсистем когнітивної карти, що продемонструвало їхню здатність до точного визначення параметрів та адаптації до змін ринкового середовища. У першому розділі проведено комплексний аналіз сучасного стану використання криптовалют у фінансових системах, а також досліджено ключові проблеми, що виникають при їхньому застосуванні. Основну увагу приділено аналізу структури та функціонування криптовалютного ринку, його основних учасників, особливостей механізмів майнінгу та факторів, що впливають на курс криптовалют. Розглянуто основні принципи функціонування криптовалют, зокрема біткоїна, як найпоширенішого цифрового активу. Досліджено базові технологічні аспекти, включаючи механізм блокчейну, алгоритми підтвердження транзакцій (Proof of Work, Proof of Stake), а також питання децентралізації та безпеки. Проаналізовано особливості емісії криптовалюти, вплив майнінгу на стабільність мережі та фактори, що визначають обчислювальну складність видобутку блоків. Виявлено основні фактори, що спричиняють коливання курсу криптовалют, серед яких макроекономічні показники, поведінка великих інвесторів, новинний фон, зміни в законодавстві, регуляторні обмеження та спекулятивні операції. Розглянуто відмінності між криптовалютним ринком та традиційними фінансовими ринками, зокрема відсутність централізованого управління, анонімність учасників та специфіку ліквідності цифрових активів. Окрему увагу приділено процесу майнингу та його вплив на фінансову систему. Розглянуто структуру винагороди за видобуток блоків, зміну рівня складності обчислень, витрати на електроенергію та їхній вплив на курс криптовалюти. Проаналізовано ризики централізації майнінгу через концентрацію обчислювальних потужностей у великих пулах, що може призвести до можливих атак, таких як атака 51%. Окрім цього, у розділі розглянуто ризики та виклики, пов’язані з використанням криптовалют. Досліджено проблеми кібербезпеки, потенційні загрози хакерських атак, фінансування незаконних операцій та шахрайства. Виявлено проблеми масштабованості блокчейну, що обмежують швидкість обробки транзакцій та створюють потребу в розвитку нових технологічних рішень, таких як Lightning Network. В кінці розділу розглянуто існуючі методи прогнозування курсу криптовалют та методи керування імпульсними процесами в когнітивних картах складних систем. Було виявлено, що традиційні економетричні та статистичні методи прогнозування мають обмежену ефективність у контексті криптовалютного ринку через його нестабільність та високу залежність від соціальних і спекулятивних факторів. Це обґрунтовує необхідність застосування нових підходів, зокрема когнітивного моделювання, методів імпульсного управління та ведення різнотемпової дискретизації. У другому розділі було розроблено когнітивну карту, яка моделює взаємозв’язки між ключовими факторами, що впливають на курс криптовалют на фінансових ринках. Дослідження розпочалося з аналізу основних параметрів, які визначають динаміку цифрових активів. Виявлено, що на формування курсу впливають як внутрішні, так і зовнішні чинники, зокрема технічні особливості блокчейну, процеси майнингу, рівень ліквідності активів, регуляторна політика та макроекономічні умови. Визначено взаємозв’язки між цими елементами та побудовано математичну модель, яка дозволяє аналізувати їхній вплив на курс криптовалют. Для забезпечення більшої точності відтворення реальних процесів у розробленій моделі було поведено декомпозицію розробленої когнітивної карти на дві з різнотемповою дискретизацією . Це означає поділити когнітивну карту на дві підсистеми: швидкозмінну, що охоплює такі явища, як коливання біржових цін, спекулятивні операції та зміни у попиті, і повільнозмінну, яка включає довгострокові процеси, такі як зміни у законодавстві, рівень довіри інвесторів та макроекономічні тенденції. Такий підхід дозволив точніше описати поведінку фінансової системи та виділити критичні фактори, які впливають на стабільність курсу. Для розроблених систем запропоновано методи придушення зовнішніх і внутрішніх обмежених збурень у підсистемах когнітивної карти. Запропоновано метод інваріантних еліпсоїдів, а саме мінімізація сліду матриці еліпсоїда в якості критерію оптимальності для управління процесами на основі різнотемпової дискретизації. Окремо в розділі розглянуто побудову когнітивної карти процесів майнингу, яка враховує зміну кількості майнерів, обчислювальну складність мережі, курс криптовалют та енергетичні витрати. У третьому розділі розроблено координувальну систему керування співвідношеннями координат у когнітивній карті криптовалютного ринку та розроблено методи ідентифікації матриць суміжності в моделі імпульсного процесу з різнотемповою дискретизацією. Для вирішення проблеми збереження оптимального співвідношення ключових економічних параметрів, характерних торгівлі цінними активами на біржі, було розроблено систему координувального управління, яка дозволяє підтримувати стабільність системи шляхом варіювання координатами вершин когнітивної карти та зберігати взаємозв’язки між її ключовими параметрами. В якості критерію оптимальності було обрано мінімізацію узагальненої дисперсії нев’язки між вектором задаючих дій, управління та власне стану системи. Для забезпечення адаптивності отриманої системи було окремо розроблено методи ідентифікації матриць суміжності, що визначають зв’язки між вершинами когнітивної карти. Запропоновано алгоритм, який дозволяє оновлювати вагові коефіцієнти зв’язків у відповідь на зміни в ринковому середовищі. Окремо розглянуто ідентифікацію вагових коефіцієнтів для підсистем із швидкозмінними та повільнозмінними координатами. В процесі роботи над методом ідентифікації було запропоновано модифікацію стандартного методу РМНК, та РМНК з експоненційним забуванням для додаткового придушення впливу шуму. Емпіричним чином було виявлено обмеження використаних методів ідентифікації підсистем когнітивної карти. В четвертому розділі представлено практичні перевірки теоретичних концепцій, розроблених у попередніх розділах. Зокрема представлено результати моделювання імпульсних процесів у когнітивній карті майнингу та когнітивній карті використання криптовалют на фінансових ринках. Було промодельовано ефективність запропонованих методів стабілізації курсу криптовалют на основі методу інваріантних еліпсоїдів та з координацією співвідношенням окремих вершин КК. Проведено серію експериментальних досліджень для перевірки запропонованих алгоритмів ідентифікації вагових коефіцієнтів матриць суміжності когнітивної карти використання криптовалют на фінансових ринках. Результати дослідження мають значну практичну цінність для аналізу та управління ринком криптовалют. Розроблені математичні моделі когнітивних карт дозволяють оцінювати вплив різних економічних, технологічних та спекулятивних факторів на курс криптовалют, що може бути використано для прогнозування їхньої вартості та стабілізації ринку. Розроблені алгоритми ідентифікації матриць суміжності забезпечують адаптивне оновлення моделі у режимі реального часу, що дає змогу оперативно реагувати на зміни ринкової ситуації та враховувати вплив зовнішніх факторів, таких як регуляторні рішення, макроекономічні тенденції та соціальні настрої. Запропоновані методи можуть бути використані у фінансових установах, криптовалютних біржах, блокчейн-проєктах та системах управління ризиками. Вони дозволяють підвищити ефективність торгових стратегій, забезпечити стабільність цифрових активів та сприяти інтеграції криптовалют у традиційні фінансові системи. Також отримані результати можуть бути використання для створення нових криптовалют з механізмами вбудованого керування і покращеною (більш стабільною) природою. Модифіковані алгоритми ідентифікації вагових коефіцієнтів когнітивних карт можуть бути використані у фінансовому прогнозуванні, торгових ботах та автоматизованих системах управління активами. Окрім цього, результати дослідження використовуються у навчальному процесі та можуть бути корисними для спеціалістів у сфері фінансів, блокчейн технологій та автоматизованого управління.Документ Відкритий доступ Глибоке навчання з підкріпленням для задач роботизованого догляду(КПІ ім. Ігоря Сікорського, 2025) Титаренко, Андрій Миколайович; Касьянов, Павло ОлеговичТитаренко А. М. Глибоке навчання з підкріпленням для задач роботизованого догляду. – Кваліфікаційна робота на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 01.05.04 «Системний аналіз і теорія оптимальних рішень» (124 – Системний аналіз). – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», 2025. Дисертаційна робота присвячена розробці та дослідженню алгоритмів керування на основі глибокого навчання з підкріпленням та імітації для задач автоматизованого догляду. Проблематика, що лежить в основі дослідження, є надзвичайно актуальною з огляду на глобальні демографічні зміни, які проявляються у старінні населення та нестачі людських ресурсів для забезпечення повноцінного догляду за пацієнтами. Метою дослідження є створення алгоритмів, здатних керувати роботизованими системами для задач догляду, забезпечуючи при цьому високу адаптивність, безпеку та ефективність у непередбачуваних умовах. Дисертація складається із семи розділів, у яких детально розглянуто як теоретичні основи методів глибокого навчання з підкріпленням, так і практичні аспекти їх реалізації для систем роботизованого догляду. У першому розділі розглянуто загальні проблеми роботизованого догляду в контексті глобальних демографічних змін та сучасних викликів. Особлива увага приділена потребам України, де війна значно збільшила кількість людей, які потребують тривалого догляду та реабілітації. Визначено ключові технічні та соціальні перешкоди для впровадження автоматизованих систем, серед яких висока вартість, технічна складність та необхідність забезпечення безпеки під час фізичної взаємодії з пацієнтами. Розглянуто існуючі системи роботизованого догляду, визначено ключові недоліки та переваги, а також основний напрям досліджень, результати яких повинні виправити основні проблеми існуючих підходів. Також надані загальні відомості про базові методи навчання з підкріпленням та імітацією, що використовуються в роботі. Надано формальне визначення Марковських процесів ухвалення та їх розширень, що лежать в основі методів, що розглядаються. Другий розділ зосереджено на розробці стратегій керування, що забезпечують робастність та стійкість роботизованих систем. Запропоновано нові методи на основі дифузійних стратегій та алгоритмів навчання з підкріпленням, що дозволяють зменшити ризики виникнення помилок у поведінці робота. Значну увагу приділено розробці підходів для оптимізації цільових функцій, що дозволяють системам ефективно виконувати завдання навіть в умовах обмеженої кількості навчальних даних. Результати експериментів продемонстрували, що поєднання методів навчання з підкріпленням та навчання імітацією дозволяє підвищити якість керування та адаптивність системи, зменшивши необхідну кількість даних на етапі навчання з підкріпленням. Цікавим спостереженням є те, що навчаючи нейромережеву стратегію методами дифузійних стратегій на перших успішних траєкторіях, згенерованих за допомогою навчання з підкріпленням, можливо отримати рівень успішності на рівні повністю навченої стратегії навчанням з підкріпленням, або навіть краще. При цьому, важливо пам’ятати, що для повної збіжності онлайн методів навчання з підкріпленням потрібна велика кількість даних – взаємодій із середовищем, що може унеможливити практичне застосування. У третьому розділі досліджено методи навчання візуальних нейромережевих стратегій для керування системами догляду. Проблема полягала у необхідності обробки неповних або неточних даних сенсорів, що характерно для реальних умов експлуатації роботів. Запропоновано архітектуру нейронної мережі, яка забезпечує стабільне керування на основі візуальної інформації без привілейованих даних. Результати симуляцій у системах Assistive Gym показали високу ефективність запропонованих стратегій. Підхід дозволяє розвинути методологію запропоновану в другому розділі, розширюючи застосовність до реалістичних систем роботизованого догляду. Четвертий розділ присвячено розробці методів раннього виявлення аномальної поведінки нейромережевих стратегій для підвищення безпеки систем догляду. Основні способи оцінки ризику або аномальності стратегії включають ансамблі прогнозних моделей. В розділі спочатку досліджуються моделі такого типу, їх варіації та модифікації. Далі виводиться метод, який використовує нормалізуючі потоки для моделювання очікуваної поведінки системи та ідентифікації відхилень у реальному часі. Він базується на існуючому методі виявлення аномалій в часових рядах, здатному оцінювати аномальність ряду тільки маючи повний часовий ряд, але при цьому дозволяє виявляти аномалії в реальному часу якомога раніше. Запропонований підхід дозволив значно мінімізувати ризики виникнення критичних ситуацій, що підтверджено в рамках обчислювальних експериментів. Експериментальна валідація показала, що запропонований метод не тільки перевершує базовий, але ще і перевершує методи на базі ансамблів прогнозних моделей та інших методів виявлення аномалій в часових рядах. У п’ятому розділі в фокусі опиняється клас методів вивчення керованого середовища. Загалом такі методи дозволяють знизити розмірність простору станів середовища таким чином, щоб отриманий прихований простір станів мав динаміку, яка є гладкою або локально-лінійною. Застосування подібних методів до задачі автоматизованого догляду дозволило б підвищити інтерпретованість стратегій, а відповідно і збільшити безпечність системи. В розділі розглядається модель embedto-control (E2C), яка хоч і не найбільш ефективною в сімействі, але є простою для застосування. Для того, щоб покращити якість, використовується багатокрокове прогнозування, що дозволяє переформулювати варіаційну модель процесу і вивести нову функцію втрат для оптимізації. Для підвищення стійкості було впроваджено регуляризаційну функцію на базі теореми Гершгоріна, яка дозволяє обмежити власні значення матриць переходу, прогнозованих нейронними мережами. Обмеження лінійності у випадку з багатокроковим прогнозуванням дає можливість більш явно контролювати гладкість прихованого простору і суттєво підвищити якість простого в реалізації методу, просуваючи напрям до практичної застосовності. Шостий розділ зосереджено на проблемах кодування дій та оптимізації представлень для керування системами догляду. Запропоновано підходи на основі узгодженості з кодуванням дій, що дозволяють стабілізувати поведінку системи та забезпечити робастне керування навіть у динамічних середовищах із складними просторами дій. Для впровадження кодування дій обрано два методи вивчення керованих середовищ: PCC (Прогнозування, Консистентність, Кривизна) та PC3 (Предиктивне кодування, Послідовність, Кривизна). Для PCC виведено варіаційну функцію втрат та проведено аналіз субоптимальності. Для PC3 виведено функцію втрат на базі предиктивного кодування та також проведено аналіз субоптимальності. Отримані підходи досліджено емпірично в середовищах із ускладненими просторами дій (керування). Показано, що підхід дозволяє застосовувати класичні методи керування на базі ітеративного лінійноквадратичного регулятора в отриманих просторах станів навіть із дискретними просторами дій. Сьомий розділ присвячений розробці цілісної багатокомпонентної системи керування для задач роботизованого догляду на базі нейромережевих стратегій. Спочатку запропоновано і реалізовано фізичну систему керування для задач годування з використанням методів навчання імітацією. Для адаптації до задачі було запропоновано механізми згладжування траєкторій та коригування поведінки. Перший суттєво пришвидшує обчислення нейронних мереж при збереженні гладкості траєкторій. Це є важливим для задачі годування, де на ложці знаходиться їжа, а тому різкі або «рвані» рухи роботизованої руки можуть призвести до втрати їжі і провалу завдання. Коригування поведінки дозволяє адаптувати стратегію до особливостей пацієнтів та виправити проблемні елементи траєкторій, згенерованих функцією стратегії. Метод полягає в реалізації можливості для оператора у критичній ситуації перехопити керування системою, а також у можливості використання отриманих даних для до-навчання функції стратегії на основі маскування епізоду. В другій частині розділу пропонується та розглядається повноцінна гібридна система керування роботизованим пристроєм для догляду. Вона включає в себе методи оцінки пози людини в площині зображення з камери, проєкції пози в тривимірний простір та оцінки аномальності поведінки робота та пацієнта в реальному часі для підвищення безпеки за незвичайних обставин. Проєкції поз разом із даними щодо одометрії утворюють часовий ряд, до якого застосовується алгоритм раннього виявлення аномалій, представлений раніше в дисертації. Отримана система підтримки прийняття рішень є наскрізною, тобто такою в якій керування реалізується нейронною мережею за сенсорними сигналами та виходами інших нейронних мереж. Це знижує вартість системи зменшуючи залежність від дорогих компонент (точних приводів, лідарів, великої кількості камер тощо). Крім того, це надає можливості забезпечення безпеки у разі, якщо середовище (пацієнт і робот) перестає бути прогнозованим. Усі ці можливості були оцінені в емпіричному дослідженні, де метод застосовувався як до симульованих систем годування та маніпуляції кінцівками, так і до фізичної системи годування. Були досліджені показники успішності порівнюваних алгоритмів, а також точність системи раннього виявлення аномалій при різних порогових значеннях. Практичне значення отриманих результатів полягає у можливості використання запропонованих методів для створення ефективних та доступних систем роботизованого догляду, що можуть застосовуватись у реабілітаційних центрах, медичних закладах та для домашнього догляду. Впровадження таких систем дозволить значно зменшити навантаження на медичний персонал та забезпечити якісний догляд за пацієнтами. Фізична реалізація запропонованої системи також була розроблена за результатами досліджень в рамках роботи.