Дисертації (ПЗКС)

Постійне посилання зібрання

https://ela.kpi.ua/handle/123456789/14864

У зібранні розміщено дисертації, які захищені працівниками кафедри.

Переглянути

Зараз показуємо 1 - 13 з 13

Відкритий доступ
Методи та програмне забезпечення візуалізації мультимодальних темпоральних потокових даних пристроїв IoT
(КПІ ім. Ігоря Сікорського, 2026) Лук'янець, Михайло Олександрович; Сулема, Євгенія Станіславівна
Лук'янець М.О. Методи та програмне забезпечення візуалізації мультимодальних темпоральних потокових даних пристроїв IoT. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії в галузі знань 12 Інформаційні технології за спеціальністю 121 Інженерія програмного забезпечення. – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2025. Стрімкий розвиток екосистем IoT та кіберфізичних систем спричинив створення нової парадигми цифрової взаємодії з фізичним світом, згідно з якою безперервно генеруються й циркулюють потоки мультимодальних темпоральних даних, які відображають сенсорні вимірювання, відео й аудіопотоки, дані телеметрії та подієвих журналів, що характеризуються різною частотою дискретизації, нерівномірними затримками, пропусками та шумами. Особливістю таких даних є їхня висока динамічність та неоднорідність, що ускладнює процес інтеграції, синхронізації та подальшої інтерпретації. Постійне зростання кількості джерел інформації вимагає від програмних систем здатності до масштабування під час інтенсивного навантаження. Візуалізація цих потоків у програмних системах виконує не лише функцію відображення, а й є ключовим інструментом оперативного аналізу, виявлення аномалій і підтримки прийняття рішень у режимі реального часу, з урахуванням людського фактору та вимог до інтерпретованості. Процеси візуалізації виступають проміжною ланкою між отриманням мультимодальних потоків «сирих» даних від пристроїв ІоТ і аналізом інформації про об’єкти моніторингу користувачем, забезпечуючи перехід від неструктурованих числових масивів до більш зрозумілих графічних моделей. Попри істотний прогрес у створенні графічних інтерфейсів для візуалізації потокових даних залишається низка викликів: гетерогенністьформатів і протоколів, відсутність уніфікованих моделей представлення мультимодальних потоків, складність часової синхронізації за умов запізнілих і невпорядкованих подій, а також брак стандартизованих архітектур і шаблонів проєктування для систем візуалізації. Це ускладнює проєктування програмних систем, здатних адаптуватися до специфіки конкретних пристроїв без суттєвої зміни існуючих частин систем. Окремою проблемою є забезпечення стабільності відображення раніше візуалізованих даних під час їх безперервного оновлення та ресемплінгу, що напряму впливає на довіру користувача до аналітичних матеріалів. Стабільність відображення у візуальному представленні зменшує кількість помилок оператора системи при тривалій роботі з візуалізованими даними. Ситуацію ускладнюють обмеження обчислювальних ресурсів (особливо на місцях роботи операторів) і когнітивне перевантаження операторів при роботі з багатоподієвими потоками високої інтенсивності. Аналіз наявних програмних рішень свідчить про їхню фрагментованість і вузькоспеціалізованість, орієнтацію на окремі вертикалі пристроїв або конкретних виробників, обмежену переносимість і повторне використання компонентів. Подолання зазначених бар’єрів потребує створення уніфікованих, гнучких і масштабованих програмних підходів та рішень, які поєднують подієво-орієнтоване оброблення, механізми надійної часової узгодженості та архітектурні рішення для стабільної, інтерпретованої візуалізації мультимодальних потокових даних у реальному часі. Розв’язанню саме цієї науково-технічної задачі й присвячено дисертаційну роботу. Метою дисертаційної роботи є підвищення ефективності процесів створення програмного забезпечення візуалізації потокових даних пристроїв IoT. У першому розділі виконано аналіз методів оброблення та візуалізації IoT-даних, підходів до часової синхронізації та архітектурпотокового аналізу, сформульовано вимоги до програмного забезпечення і критерії якості. Окрему увагу приділено особливостям візуальної аналітики у доменах кібербезпеки та радіомоніторингу. Додатково проаналізовано обмеження відомих рішень щодо масштабованості та стабільності відображення даних, що визначило напрям подальших досліджень. У другому розділі розроблено метод групування мультимодальних потокових даних з урахуванням темпорального параметру даних на основі підходів реактивного програмування. Запропонований підхід надає змогу обробляти події асинхронно, використовуючи механізми потокового планування та оброблення у реальному часі, що робить його придатним для високонавантажених систем IoT. Описано механізми узгодження часових міток і роботи з запізнілими подіями, що забезпечують коректне поєднання даних із різних каналів, навіть у разі різної частоти надходження інформації або імовірних затримок спричинених мережевими проблемами. Також перевірено швидкодію розробленого методу декількома замірами часу виконання для різної кількості вхідних даних. У третьому розділі запропоновано метод стабільного відображення точкових темпоральних даних із даунсемплінгом у межах змінної частини даних, що не порушує уже відображені дані. На відміну від повного оновлення відображуваних даних, де зміна масштабів чи ресемплінг можуть призводити до перемальовування всієї сцени, у цьому підході введено принцип поділу буфера на застарілу, стабільну та активну зони, що уможливлює мінімізацію обчислювальних витрат та надає можливість зберегти візуальну узгодженість. У четвертому розділі представлено узагальнену архітектуру програмного забезпечення, що підтримує централізовані та децентралізовані розгортання, наведено перелік виділених функціональних та нефункціональних вимог до програмного забезпечення IoT, запропоновані варіанти реалізації частин архітектури залежно від потреб, а також розроблено архітектурний шаблон проєктування програмногозабезпечення Multimodal Stream Stable Visualization (MSSV) для відображення мультимодальних потокових даних, який визначає організацію презентаційного шару та взаємодію його ключових компонентів між собою. Для цього архітектурного шаблону розроблено узагальнену схему користувацького інтерфейсу, що ілюструє узгоджене подання багатовимірних потоків і перехід від розрізненого відображення даних до інтегрованого інтерфейсу. Розглянуто можливості інтеграції архітектури з наявними інфраструктурами та шляхи масштабування під різні сценарії використання. У дисертаційній роботі отримано низку нових наукових результатів, зокрема, уперше розроблено метод подієво-орієнтованого групування наборів мультимодальних темпоральних даних, особливістю якого є використання попередньо заданих часових вікон і правил відкладеного злиття пізніх подій та врахування заданої максимально допустимої розбіжності у часі надходження даних, що уможливлює групування даних за наявності лише частини потоків, які безперервно надходять з IoT пристроїв. Уперше розроблено метод візуалізації, який, на від відміну від відомих методів, забезпечує незмінність вже візуалізованих фрагментів потоку під час надходження нових даних і застосування до них ресемплінгу, що дає змогу знизити навантаження на комп’ютерну систему в умовах високої інтенсивності передавання даних з IoT пристроїв. Уперше розроблено узагальнену архітектуру програмного забезпечення візуалізації потокових даних пристроїв IoT, характерними рисами якої є: подієво-орієнтоване групування темпоральних мультимодальних даних та стабільне відображення даних великих обсягів у реальному часі, що забезпечує розширення функціональних можливостей візуалізації для систем оброблення даних ІоТ та уможливлює розроблення користувацьких інтерфейсів нового типу – подієво-орієнтованих інтерфейсів систем підтримки прийняття рішень. Уперше розроблено архітектурний шаблон проєктування MSSV, який, на відміну від відомих, призначений для оперування згрупованими потоками даних, що робить можливим спрощення процесів розроблення програмних засобів візуалізації потокових даних пристроїв IoT із забезпеченням подієво-орієнтованого та синхронізованого відображення даних великих обсягів. Основні наукові результати дисертаційної роботи опубліковано у 8 наукових працях, зокрема у 4 наукових статтях, опублікованих у фахових виданнях, включених до переліку наукових фахових видань України з присвоєнням категорії «Б», та у 4 матеріалах наукових конференцій.
Відкритий доступ
Методи та програмне забезпечення для аналізу продуктивності вебзастосунків на основі моделей машинного навчання
(КПІ ім. Ігоря Сікорського, 2026) Бурчак, Павло Володимирович; Олещенко, Любов Михайлівна
Бурчак П. В. Методи та програмне забезпечення для аналізу продуктивності вебзастосунків на основі моделей машинного навчання – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії з галузі знань 12 Інформаційні технології за спеціальністю 121 Інженерія програмного забезпечення. – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2026. У сучасних вебзастосунках продуктивність є комплексною кількісною характеристикою його здатності забезпечувати обробку запитів та генерацію відповідей із заданими показниками швидкодії, пропускної здатності, масштабованості та використання обчислювальних ресурсів за визначених умов навантаження. Аналіз наявних засобів моніторингу вебзастосунків показав, що вони здебільшого орієнтовані на збирання та візуалізацію показників продуктивності. Вагомою проблемою є відсутність єдиної структури для аналізу вебзастосунків різних архітектур, врахування їх особливостей, а також відсутність механізмів пояснення, здатних визначати вплив відповідних факторів (ознак) на зміну показників продуктивності вебзастосунку. Вирішення цих проблем можливе через створення спеціалізованого програмного забезпечення (ПЗ), яке використовує модель ознак продуктивності, інтегрує методи пояснюваного машинного навчання та забезпечує адаптивний вибір архітектурного рішення відповідно до прогнозованих ризиків деградації. Методи прогнозування та пояснюваного машинного навчання широко застосовуються у фінансовій сфері, виробництві та медичних інформаційно-аналітичних системах. Натомість відсутні рішення, орієнтовані на інженерію продуктивності вебзастосунків та прийняття архітектурно-орієнтованих рішень на основі пояснюваних моделей. Попри те, що потреба у таких інструментах зростає, наявні системи не враховують складні структурні залежності між компонентами вебсистем, а також не інтегрують механізми автоматичного вибору архітектури. Тому актуальним є наукове завдання удосконалення теоретичних та методологічних основ аналізу продуктивності вебзастосунків з використанням моделей машинного навчання, пояснюваності та адаптивного архітектурного вибору, що виконується у даній дисертаційній роботі. Метою дисертаційної роботи є підвищення точності відбору ключових ознак, що визначають зміну показників продуктивності вебзастосунків та зменшення споживання ресурсів під час експлуатації цифрових вебсистем. У першому розділі дисертації проведено аналіз сучасних підходів та програмних засобів для моніторингу продуктивності вебзастосунків, оцінено можливості підходів наявних систем та визначено їх обмеження щодо універсальності, енергоефективності, пояснюваності та адаптивності архітектурних рекомендацій. Проведений аналіз існуючих систем моніторингу продуктивності вебзастосунків показав, що більшість з них є закритими комерційними рішеннями з обмеженою можливістю адаптації до різних архітектур вебзастосунків та недостатньою інтерпретацією результатів аналізу. Виявлено недоліки традиційних методів, що спираються на статичні моделі і ручне налаштування порогових значень та не враховують динаміку навантажень та розподілений характер обробки даних вебзастосунків. Сформульовано функціональні та нефункціональні вимоги до програмного забезпечення. У другому розділі на основі моделей машинного навчання розроблено методи відбору ключових ознак, що визначають зміну показників продуктивності вебзастосунків різної архітектури, які поєднують структурні, кореляційні та контекстно-адаптивні підходи до відбору ключових ознак продуктивності. Запропоновано графово-орієнтований метод визначення найважливіших ознак продуктивності, багатофакторну модель злиття телеметрії, а також спеціалізовані процедури для безсерверних та хмарних архітектур з динамічним масштабуванням. Запропоновані методи забезпечують пояснюваність аналізу завдяки SHAP-подібним індикаторам впливу ознак та дозволяють формувати інтерпретовані гіпотези щодо можливих причин деградації продуктивності вебсистем, формуючи основу для інтелектуального вибору архітектурних рішень. У третьому розділі проведено експериментальну перевірку запропонованих методів, включно з побудовою датасетів, навчанням моделей та їх валідацією на синтетичних та реальних телеметричних даних. Виконано порівняльний аналіз точності класифікації архітектур вебзастосунків, досліджено якість відбору ключових ознак, а також оцінено масштабованість та стійкість запропонованих моделей у сценаріях зростання навантаження. Додатково реалізовано інтерпретацію результатів за допомогою методів SHAP та LIME, що забезпечило інтерпретацію прогнозів та додаткову перевірку узгодженості виявлених статистичних залежностей. Для формування бази даних було здійснено збір телеметричної інформації, який об’єднав реальні дані з промислових систем та синтетично змодельовані сценарії навантаження. Дані отримувалися з корпоративних середовищ Kubernetes, AWS Lambda, Google Cloud Run та Azure App Services з використанням систем Prometheus, OpenTelemetry Collector та Jaeger. Процес навчання моделей машинного навчання реалізовувався в єдиному експериментальному середовищі на базі бібліотек PyTorch Lightning, MLflow та Spark ML. Отримані результати свідчать про наукову обґрунтованість та практичну доцільність застосування розроблених методів у досліджуваних умовах. У четвертому розділі розроблено архітектуру ПЗ для інтелектуального аналізу продуктивності вебзастосунків, яка поєднує модулі збору телеметрії, обробки даних, прогнозування, пояснюваного машинного навчання та надання рекомендацій веброзробникам. Запропоновано архітектурний шаблон, що автоматизує вибір архітектурного стилю за ознаками продуктивності. Розроблено вебінтерфейс та REST API для інтерактивної роботи з показниками продуктивності, трасуваннями та SHAP-поясненнями. Запропонована архітектура підтримує контейнеризоване розгортання, інтеграцію з інфраструктурою моніторингу та демонструє переваги щодо енергоефективності, точності рекомендацій та використання ресурсів. Наведено експериментальні дослідження аналізу вебзастосунків різної архітектури та порівняння розробленого програмного забезпечення з наявними рішеннями. У дисертаційній роботі отримано низку нових наукових результатів. Уперше запропоновано топологічно-орієнтований метод відбору ознак TAM-GNN, який, на відміну від класичних статистичних методів, враховує структурну взаємозалежність компонентів вебзастосунку за допомогою графових нейронних мереж GNN, що забезпечує підвищення точності виявлення критичних зон деградації продуктивності вебзастосунків у середньому на 27 %. Уперше розроблено кореляційно-графовий метод DCA-MicroNet, що, на відміну від класичних кореляційних методів, використовує графові нейронні мережі з механізмом уваги, SHAP-інтерпретації та пояснюваний аналіз міжсервісних залежностей, що дозволяє скоротити час локалізації «вузького місця» в мікросервісних вебзастосунках у середньому на 37 % Уперше запропоновано контекстно-адаптивний метод CMA-CloudNet, що, на відміну від статичних методів відбору ознак, поєднує механізми навчання з підкріпленням та контекстну адаптацію, що дозволяє зменшити час реакції системи аналізу продуктивності хмарних вебзастосунків у середньому на 27 %. Удосконалено багатофакторну модель злиття показників продуктивності AMF-MonoNet, яка, на відміну від традиційних моделей, поєднує PCA, LASSOрегуляризацію та аналіз взаємної інформації, забезпечуючи формування ортогоналізованого ядра ознак для монолітних вебсистем, що уможливлює зменшення середньої абсолютної похибки оцінювання часу відгуку монолітних вебзастосунків в середньому на 28 %. Розроблені методи та програмне забезпечення надають можливість автоматизованого аналізу продуктивності вебзастосунків з урахуванням архітектури системи та динаміки навантаження. Запропоноване програмне забезпечення дозволяє веброзробникам оперативно виявляти «вузькі місця» та оптимізувати роботу вебсервісів. Розроблене програмне забезпечення, на відміну від промислових APM-платформ, знижує використання CPU, RAM та енергоспоживання. Запропонована модель формування рекомендацій, на відміну від шаблонних порад у класичних моніторингових системах, враховує внесок кожної ознаки, ефект конкретної дії та підвищує релевантність рекомендацій. Запропонований архітектурний шаблон Adaptive Architectural Selection Pattern, на відміну від статичних APM-рішень, дозволяє автоматично адаптуватися до архітектурного класу вебзастосунку, забезпечуючи скорочення часу діагностики інцидентів. Запропонований метод CEA-ServerlessNet, на відміну від традиційного суцільного моніторингу, використовує багатокритеріальну та Байєсівську оптимізацію для адаптивного визначення частоти збору показників з урахуванням «холодних стартів», часу виклику функцій та вартості виконання обчислень, що дозволяє зменшити середню похибку оцінювання часу відгуку приблизно на 43 %. У дисертаційній роботі вирішене наукове завдання підвищення точності виявлення ключових ознак, що впливають на результати аналізу продуктивності вебзастосунків різної архітектури та зменшення споживання ресурсів під час експлуатації цифрових систем. Досягнуті результати забезпечують автоматизоване виявлення критичних аномалій, формування рекомендацій для веброзробників та зниження ресурсоспоживання під час моніторингу, що є особливо важливим у контексті використання цифрової інфраструктури України в умовах обмежених енергетичних ресурсів. Програмна реалізація запропонованих у дисертації методів може бути інтегрована в середовища DevOps та CI/CD, що дозволить підвищувати ефективність процесів розроблення, тестування та експлуатації вебзастосунків. Основні наукові результати дисертаційної роботи опубліковано у 9 наукових працях, зокрема, у 4 наукових статтях, опублікованих у фахових виданнях, включених до переліку наукових фахових видань України з присвоєнням категорії «Б», та у 5 матеріалах науково-технічних конференцій.
Відкритий доступ
Алгоритмічне та програмне забезпечення для виявлення та прогнозування екологічних загроз на основі аналізу гетерогенних потокових даних
(КПІ ім. Ігоря Сікорського, 2026) Ільїн, Максим Олександрович; Олещенко, Любов Михайлівна
Ільїн М. О. Алгоритмічне та програмне забезпечення для виявлення та прогнозування екологічних загроз на основі аналізу гетерогенних потокових даних – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії з галузі знань 12 Інформаційні технології за спеціальністю 121 Інженерія програмного забезпечення. – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2026. Оброблення та аналіз гетерогенних потокових даних екологічного моніторингу є складною задачею через різнорідність форматів, асинхронність надходження, багатомовність та змінюваність форм слів у текстах, невідповідність часових баз, різні одиниці виміру, пропуски та шуми в рядах сенсорних даних, а також вимоги до часу відгуку обчислень. Стандартні програмні конвеєри з відсутністю єдиної просторово-часової основи не забезпечують стабільного геоприв'язування та узгоджених агрегатів, що призводить до помилок у локалізації подій, дублювання супутникових виявлень та нестабільної швидкодії. У зв'язку з цим виникає потреба в інтегрованому підході, який поєднує нормалізацію форматів та часових поясів, геокодування зі збереженням коректності для різних словоформ, просторово-часове вирівнювання на шестикутній сітці та двошарову агрегацію добових індикаторів ризику. Упродовж останніх років такі підходи успішно застосовуються у задачах кризового моніторингу та геоаналітики, що підтверджує доцільність створення уніфікованого програмного засобу для високопродуктивного оброблення великих потоків даних та адаптації до мінливих умов. Метою дисертаційної роботи є підвищення швидкодії оброблення гетерогенних потокових даних, точності геоприв'язування та забезпечення відтворюваності просторово-часових показників екологічних ризиків шляхом створення алгоритмічного та програмного забезпечення для реалізації конвеєра уніфікації, геокодування та агрегації гетерогенних потокових даних. У першому розділі дисертації проведено аналіз сучасного стану досліджень з програмної аналітики потокових даних для моніторингу та прогнозування екологічних загроз. Розглянуто основні підходи до оброблення гетерогенних екологічних даних, зокрема, OSINT-повідомлень, сенсорних вимірювань та геопросторової інформації. У межах аналізу програмних рішень для моніторингу екологічних загроз було розглянуто як міжнародні програмні системи (ACLED, GDELT, Liveuamap), так і національні системи моніторингу (EcoZagroza, Ecodozor, SaveEcoBot), виявивлено їх переваги та обмеження, зокрема, у сфері інтеграції мультимодальних OSINT-джерел, оперативного геокодування та прогнозної аналітики. Аналіз наявних програмних систем моніторингу екологічних загроз підтвердив наукову та практичну актуальність розроблення алгоритмічних та програмних засобів для аналізу та прогнозування екологічних загроз на основі гетерогенних потокових даних, що важливо в умовах воєнних дій та підвищених екологічних ризиків, коли оперативна інформація та її точна інтерпретація можуть рятувати життя. Окрему увагу приділено архітектурним шаблонам сучасних програмних систем та їх структурним обмеженням. На основі проведеного аналізу було сформульовано функціональні та нефункціональні вимоги до програмного забезпечення. У другому розділі розроблено методи проєктування програмного забезпечення для аналізу гетерогенних потокових даних, орієнтовані на підтримку аналізу даних в реальному часі та прийняття рішень в умовах невизначеності. Запропоновані методи збору та попередньої обробки потокових даних з різних джерел, а також методи розпізнавання подій на основі оброблення природної мови для аналізу текстових OSINT-повідомлень. Розроблено метод геокодування зі збереженням коректності для різних словоформ у багатомовних повідомленнях. Запропоновано метод багатоджерельної перевірки та фільтрації якості подій, а також ймовірнісну геопросторову модель прийняття рішень, яка інтегрує результати аналізу гетерогенних потоків даних у єдиному формалізованому просторі. Запропонований архітектурний шаблон H3-DSMV призначений для обробки геопросторових потокових даних та поєднує принцип єдиного джерела істини, ієрархічну узгодженість просторових агрегацій та мінімальну інфраструктурну складність. Фіксація подій на дрібнішій сітці H3 з автоматичним формуванням матеріалізованих подань на вищому рівні роздільності забезпечує коректну та швидку аналітику без дублювання даних та втрати точності. Основними перевагами підходу є висока просторово-часова точність, детермінована агрегація, автоматична синхронізація подань, зменшення накладних витрат на інфраструктуру та підвищена надійність і масштабованість системи в задачах реального часу. У третьому розділі розроблено архітектуру та здійснено програмну реалізацію модульної системи оброблення потокових даних на основі мікропакетного конвеєра. Запропоновано модульну архітектуру з використанням H3-агрегації та матеріалізованих подань, що забезпечує просторово-часову агрегацію гетерогенних потоків даних. Реалізовано модулі оброблення мовних компонент, геопросторової підсистеми з підтримкою морфологічно коректного геокодування, а також спеціалізований модуль аналізу потокових даних про стан довкілля. Інтегровано прогнозування на основі LSTM-моделі для аналізу часових залежностей екологічних показників. У четвертому розділі проведено експериментальні дослідження запропонованого програмного забезпечення. Описано експериментальні сценарії та використані джерела OSINT-подій, сформульовано методологію оцінювання та обрано відповідні метрики якості. Проаналізовано результати геопросторового аналізу та прогнозування екологічних загроз, а також виконано порівняння запропонованої системи з наявними програмними рішеннями. Узагальнюючи результати проведених експериментальних досліджень, можна стверджувати, що розроблене програмне забезпечення демонструє системну перевагу над наявними рішеннями екологічного моніторингу завдяки поєднанню потокового режиму оброблення, багатоджерельної верифікації подій та просторово-часової агрегації на основі шестикутної сітки H3. На відміну від систем Safecast та SaveEcoBot, які орієнтовані відповідно на сенсорні або OSINT-дані та не забезпечують повноцінної автоматичної валідації, запропоноване програмне забезпечення інтегрує текстові повідомлення, супутникові спостереження та фізичні вимірювання, що істотно зменшує похибки та кількість хибних спрацювань. Порівняння з Copernicus EMS показало, що хоча супутникові офлайн-системи і забезпечують дещо вищу просторову точність, проте вони не придатні для оперативного реагування через значні часові затримки. Експериментальні результати підтвердили, що розроблене програмне рішення забезпечує зіставну з еталонними системами точність геопросторової локалізації подій у потоковому режимі (85% коректних прив’язувань) при суттєво меншому середньому часі отримання результату (близько 6 хв). Запровадження інтегрального показника, який поєднує точність та оперативність, дозволило обґрунтовано показати, що саме розроблене програмне забезпечення є найбільш збалансованим для задач оперативного екологічного моніторингу, перевершуючи альтернативні системи за сукупною ефективністю. Додатково було встановлено, що використання багатоджерельної перевірки та ймовірнісної моделі прийняття рішень дозволяє істотно зменшити похибку агрегованої оцінки ризику за умов неповних або зашумлених даних (до 8%), а також знизити частоту хибних спрацювань до 4%. Це є критично важливим для практичних сценаріїв, пов’язаних з воєнними та техногенними загрозами, де дані часто є фрагментованими та несинхронізованими. Оцінка експлуатаційних характеристик показала, що розроблене програмне забезпечення має значно меншу затримку оброблення та знижене ресурсоспоживання порівняно з аналізованими аналогами, що підтверджує його придатність для розгортання в умовах обмежених обчислювальних та енергетичних ресурсів. У сукупності отримані результати підтверджують наукову обґрунтованість та практичну доцільність запропонованих методів та програмної реалізації для систем оперативного моніторингу стану довкілля і раннього попередження про екологічні та техногенні загрози. Також було розглянуто переваги та особливості практичного впровадження розробленого програмного забезпечення. Наукова новизна одержаних результатів полягає в наступному. Уперше розроблено метод геокодування зі збереженням коректності для різних словоформ багатомовних OSINT-повідомлень, характерними рисами якого є поєднання морфологічної нормалізації змінюваних форм, каскаду точного, нечіткого та фонетичного зіставлення з реєстром географічних назв та усунення контекстуальної неоднозначності в локальному оточенні H3, що, на відміну від існуючих методів геокодування, орієнтованих на англомовні тексти, дає змогу підвищити частку коректних прив’язувань топонімів в середньому на 21% та скоротити середній час пошуку координат в середньому на 51 %. Уперше розроблено ймовірнісну геопросторову програмну модель прийняття рішень на основі аналізу гетерогенних потокових даних, характерними рисами якої є інтеграція результатів геокодування, багатоджерельної перевірки та доменної агрегації на шестикутній сітці H3 з підтримкою сценарних обмежень, що, на відміну від відомих моделей, дає змогу оцінювати небезпечні зони, формувати рекомендації щодо планування евакуації та розміщення нових укриттів з кореляцією 0,78 з офіційними повітряними тривогами. Уперше розроблено архітектуру уніфікованого мікропакетного конвеєра гармонізації гетерогенних потоків даних, характерними рисами якого є детерміноване перетворення подій до єдиної часової бази, нормалізація одиниць вимірювання та уніфікація схем подій у межах одного процесу, що, на відміну від стандартних багатоетапних ETL-конвеєрів, дає змогу скоротити затримку уніфікації в середньому на 80%. Уперше розроблено архітектурний шаблон H3-DSMV (Dual Scale Materialized Views) для аналізу гетерогенних потоків даних, характерними рисами якого є фіксація подій на дрібнішій сітці r10 з автоматичною побудовою та підтримкою матеріалізованих подань на вищій сітці r7, що, на відміну від розподілених архітектур з окремими компонентами агрегації, дає змогу в 5 разів скоротити середній час відповіді системи. Запропоновані методи та програмне рішення забезпечують безперервний моніторинг екологічних ризиків, підтвердження подій за кількома джерелами, формування добових просторово-часових індикаторів для підтримки прийняття рішень органами цивільного захисту та екологічного нагляду, а також застосування на обмежених обчислювальних ресурсах у режимі автономної роботи. Удосконалені процедури доменної агрегації ризику для гетерогенних потокових даних екологічного моніторингу, на відміну від існуючих процедур, поєднують FRP-агрегацію, метеокорекцію для врахування вітру та метеофакторів, нормування радіаційних показників та єдину часову базу. Запропонований метод інтеграції LSTM-прогнозування у єдиний просторово-часовий конвеєр екологічного моніторингу, на відміну від реактивних методів моніторингу, забезпечує перехід до проактивного режиму підтримки рішень на основі короткострокових прогнозів. Основні наукові результати дисертаційної роботи опубліковано у 11 наукових працях, зокрема, у 6 наукових статтях, опублікованих у фахових виданнях, включених до переліку наукових фахових видань України з присвоєнням категорії «Б», та у 5 матеріалах науково-технічних конференцій.
Відкритий доступ
Методи та програмне забезпечення аналізу графа Біткоїн-транзакцій
(КПІ ім. Ігоря Сікорського, 2026) Жикін, Юрій Сергійович; Онай, Микола Володимирович
Жикін Ю. С. Методи та програмне забезпечення аналізу графа Біткоїн-транзакцій. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії в галузі знань 12 Інформаційні технології за спеціальністю 121 Інженерія програмного забезпечення. – Національний технічний університет України “Київський політехнічний інститут імені Ігоря Сікорського”, Київ, 2026. Протягом майже двох десятиліть з моменту своєї появи Біткоїн став важливим компонентом глобальної фінансової системи. Біткоїн водночас є системою мікроплатежів та електронної готівки, активом приватних інвестицій, інструментом міжнародних розрахунків і навіть складовою державних фінансових стратегій. Незалежність Біткоїна від державних і банківських інституцій робить його привабливим фінансовим інструментом для користувачів у політично чи економічно нестабільних регіонах. Доступ індивідуального користувача до Біткоїна практично неможливо обмежити, оскільки для більшості операцій з Біткоїном достатньо навіть низькошвидкісного доступу до Інтернету, але у цьому контексті особливо важливим є питання анонімності користувачів і безпеки їхніх персональних даних. Біткоїн, як і більшість інших криптовалютних систем, не є абсолютно анонімним. Біткоїн-протокол базується на відкритому реєстрі транзакцій, який містить всю історію операцій за весь час існування системи, і у цьому реєстрі кожен користувач представлений одним або багатьма псевдонімами, які називають адресами. Транзакції в Біткоїні утворюють складний граф переходів власності, і аналіз цього графа дає змогу встановлювати соціально-економічні зв'язки між користувачами чи організаціями, знаходити множини адрес, що належать одному й тому ж користувачу, і навіть деанонімізувати окремих користувачів. З одного боку такі можливості є корисними для правоохоронних органів у боротьбі з шахрайством, відмиванням коштів і іншою злочинною діяльністю, а також для фінансових установ у моделюванні ринку та прогнозуванні економічних процесів. З іншого боку такі можливості ставлять під загрозу право індивідуальних користувачів на приватність їхніх фінансових даних. Втім, аналіз можливостей деанонімізації користувачів допомагає виявляти слабкі місця у моделі приватності Біткоїна, що в свою чергу сприяє розробці нових протоколів та інструментів, спрямованих на покращення приватності користувачів. Дослідження методів аналізу графа Біткоїн-транзакцій є актуальним як з точки зору окремого користувача з метою захисту персональних фінансових даних від несанкціонованого втручання, так і з точки зору правоохоронних органів та організацій з метою розпізнавання операцій, що можуть вказувати на потенційну злочинну діяльність, або прямої протидії фінансових злочинам. Розроблення відкритих програмних систем аналізу графа Біткоїн-транзакцій є корисним для підвищення безпеки всієї Біткоїн-екосистеми, як з точки зору індивідуального користувача, так і з точки зору правоохоронних органів. Метою дисертаційної роботи є спрощення процесів розроблення та експлуатації програмного забезпечення для аналізу графа Біткоїн-транзакцій шляхом розроблення узагальненої архітектури програмної системи на основі спеціалізованої моделі транзакційних даних, яка надає уніфікований семантичний контракт для інтеграції програмних компонентів і забезпечує масштабоване оброблення історії транзакцій. У першому розділі дисертаційної роботи розглянуто історичні й економічні передумови появи Біткоїна і вплив цих передумов на деякі аспекти Біткоїн-протоколу. Проведено аналіз Біткоїн-протоколу і його транзакційної моделі, розглянуто структуру транзакцій і механізм формування блоків. Проаналізовано проблему приватності користувачів і технології аналізу графа Біткоїн-транзакцій з метою деанонімізації користувачів, а також розглянуто існуючі рекомендації та інструменти збереження приватності. Сформульовано загальну концепцію програмної системи, що дає змогу будувати і розширювати граф знань про транзакції, а також здійснювати патерновий аналіз такого графа. Насамкінець, сформульовано вимоги до такої програмної системи. У другому розділі розроблено спеціалізовану RDF-модель даних Біткоїн-транзакцій, адаптовану для пошуків патернів типових операцій. Для цього розглянуто підграфи графа Біткоїн-транзакцій і обрано граф, що відображає і транзакції, і транзакційні виходи, а також аргументовано вибір технології представлення великих графів, і графів знань зокрема. Розглянуто можливості використання SPARQL як універсальної мови запитів для патернового аналізу, а також розглянуто можливості розширення SPARQL спеціалізованими фільтр-функціями для спрощення складних запитів. У третьому розділі запропоновано концепцію пошуку типових операцій у графі Біткоїн-транзакцій за допомогою евристичних патернів, а також її реалізацію з використанням RDF-графа знань і SPARQL. Розроблено метод кластеризації виходів транзакцій на основі пошуку евристичних патернів типових фінансових операцій та пропагації зв'язків власності в межах таких патернів. Показано, що використання RDF-графа знань дає змогу зберігати результати проміжних ітерацій, виконувати інкрементальну кластеризацію й доповнювати її новими евристиками. Також сформульовано ідеї системного захисту від патернового аналізу графа транзакцій шляхом заміни існуючих раціональних стратегій менеджменту виходів на більш випадкові, які руйнують евристичний аналіз. Запропоновано метод захисту від патернового аналізу операцій консолідації шляхом багатокрокової симуляції операцій платежу одному отримувачу. У четвертому розділі розробляється архітектура програмної системи для побудови, розширення та дослідження графа знань про Біткоїн-транзакції, що складається з компонентів для збору даних, ETL-інтрументів, RDF-сховища графа знань, автоматизованого компоненту пропагації зв'язків та користувацького інтерфейсу для дослідження графа. Розроблено процес завантаження Біткоїн-блоків із підтримкою обробки реорганізацій ланцюга. Для реалізації і інтеграції решти компонентів розроблено і розміщено у відкритому доступі бібліотеку для взаємодії з Біткоїн-мережею з програмного середовища Common Lisp. У дисертаційній роботі отримано низку нових наукових результатів, зокрема вперше розроблено спеціалізовану модель даних Біткоїн-транзакцій, характерною рисою якої є відображення транзакцій, виходів транзакцій, власників виходів та довільних зовнішніх анотацій у єдиному RDF-графі з додатковими атрибутами, обчисленими на етапі побудови, що надає уніфікований семантичний контракт для інтеграції компонентів програмної системи аналізу графа транзакцій, забезпечує зберігання усієї історії транзакцій в межах єдиного сховища даних і уможливлює класи запитів для пошуку типових операцій, що складаються з однієї і більше транзакцій і відбуваються протягом тривалих проміжків часу. Уперше запропоновано метод евристичної кластеризації виходів Біткоїн-транзакцій, який ґрунтується на використанні спеціалізованого RDF-графа знань про Біткоїн-транзакції, що відображає повну історію транзакцій та довільні зовнішні анотації, зокрема результати попередніх аналізів, і відрізняється можливістю інкрементального виконання кластеризації з покроковою пропагацією зв'язків власності між виходами транзакцій відповідно до евристичного визначення типів операцій та збереженням проміжних результатів безпосередньо у графі знань. Уперше запропоновано метод захисту від патернового аналізу операцій консолідації виходів транзакцій, характерною рисою якого є багатокроковий процес, який симулює платежі з одним отримувачем і створює у графі транзакцій складний, стійкий до розпізнавання підграф операції, що дає змогу знижувати ризики деанонімізації та розкриття чутливої фінансової інформації. Уперше запропоновано узагальнену архітектуру програмної системи для аналізу графа Біткоїн-транзакцій, у якій спеціалізована модель транзакційних даних використовується як онтологічне ядро, що об'єднує транзакції, їхні виходи, власників та зовнішні метадані в межах єдиного RDF-графа, забезпечує накопичення внутрішніх і зовнішніх знань про транзакції у єдиному сховищі та надає уніфікований стандартизований інтерфейс взаємодії з графом знань. Основні наукові результати дисертаційної роботи опубліковано у 7 наукових працях, зокрема у 3 наукових статтях, що належать до фахових виданнях, включених до переліку наукових фахових видань України з присвоєнням категорії «Б», та у 4 матеріалах науково-технічних конференцій.
Відкритий доступ
Алгоритмічне та програмне забезпечення технології створення цифрових двійників медико-біологічних об’єктів
(КПІ ім. Ігоря Сікорського, 2024) Песчанський, Владислав Юрійович; Сулема, Євгенія Станіславівна
Песчанський В.Ю. Алгоритмічне та програмне забезпечення технології цифрових двійників медико-біологічних об’єктів. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії в галузі знань 12 Інформаційні технології за спеціальністю 121 Інженерія програмного забезпечення. – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2024. Цифрові двійники набувають дедалі більшого поширення у сфері медицини, оскільки вони дозволяють створити динамічну цифрову модель реального медико-біологічного об’єкта, відображаючи як анатомічні, так і функціональні аспекти його роботи. Ця технологія передбачає інтеграцію даних із різних джерел (медичні зображення, відеоендоскопія, аудіодані, сенсорні показники) у єдину інформаційну структуру, що описує стан і динаміку об’єкта. Цифровий двійник при цьому здатен оновлюватися у режимі реального часу, відображаючи зміни фізіологічних характеристик та надаючи можливість досліджувати, прогнозувати та моделювати розвиток патологічних процесів. Незважаючи на значний прогрес у цій сфері, існують проблеми уніфікації форматів даних, відсутність узагальнених підходів до представлення мультимодальних темпоральних сигналів та складнощі з інтеграцією технологій цифрових двійників у медичні інформаційні системи. Також потребують уваги питання анонімізації та безпеки медичних даних, стандартизації програмної архітектури, а також адаптації базових 3D-моделей під індивідуальні особливості конкретного пацієнта. Метою дисертаційної роботи є підвищення ефективності процесів проєктування медичних інформаційних систем на основі технології цифрових двійників за рахунок розроблення алгоритмічного та програмногозабезпечення для оброблення мультимодальних темпоральних даних про медико-біологічний об’єкт. Для досягнення цієї мети було розроблено метод синхронізації та семантичного аналізу темпоральних мультимодальних медико-біологічних даних, метод адаптації базової 3D-моделі медикобіологічного об’єкта, розроблено узагальнену архітектуру програмної системи для створення і використання цифрових двійників медикобіологічних об’єктів а також архітектурні шаблони проєктування для розроблення програмних систем на основі цифрових двійників медикобіологічних об’єктів. У першому розділі дисертації проаналізовано відомі методи обробки даних про медико-біологічні об’єкти, підходи до створення цифрових двійників та вимоги до програмного забезпечення. Виявлено проблеми у представленні мультимодальних даних і визначено ключові критерії для забезпечення високої точності та функціональності цифрових двійників. У другому розділі розроблено методи синхронізації темпоральних мультимодальних даних, а також семантичного аналізу та інтеграції інформації. Запропоновано використання семантичних графів та онтологій, а також графових нейронних мереж для ефективного виявлення закономірностей та прогнозування поведінки. Обґрунтовано застосування нормалізації, синхронізації сигналів, крос-кореляційного аналізу й інтеграції даних у графовій моделі. У третьому розділі розроблено метод адаптації базової 3D-моделі медико-біологічного об’єкта. Застосовано 3D-згорткові нейронні мережі для аналізу просторово-часових залежностей у відеопотоці та потоці аудіоданих. Інтегровано мультимодальний підхід, що дає змогу поєднувати інформацію з різних джерел для персоналізованого моделювання стану медико-біологічного об’єкта та його візуалізації. У четвертому розділі розроблено архітектуру медичної програмної системи на основі технології цифрових двійників. Запропонованомікросервісний підхід, використання контейнеризації, засобів безпеки, анонімізації та автоматизації тестування (CI/CD) для забезпечення масштабованості, надійності та високої якості програмного забезпечення. Описано можливості інтеграції з існуючими медичними системами, принципи проєктування інтерфейсів візуалізації та ролей користувачів у системі. У дисертаційній роботі отримано низку нових наукових результатів, зокрема, уперше розроблено узагальнену архітектуру програмної системи для створення і використання цифрових двійників медико-біологічних об’єктів, характерними рисами якої є поєднання мультимодальних темпоральних даних у форматі, який підтримує двосторонню інтеграцію з фізичним об’єктом через давачі, актуатори та інші програмно-апаратні засоби, що надає можливість перейти від фрагментарного оброблення окремих типів даних до цілісної моделі, яка може оновлюватися в реальному часі. Уперше розроблено метод синхронізації темпоральних мультимодальних даних, характерною рисою якого є поєднання відео та аудіо у єдиний потік даних, що забезпечує узгодження даних різної модальності та, у такий спосіб, спрощує процес створення цифрового двійника медико-біологічного об’єкта на основі даних, які надходять з давачів різних типів. Уперше розроблено метод семантичного аналізу для виявлення кореляцій між наборами даних та прогнозування поведінки програмноапаратних компонентів цифрового двійника, характерними рисами якого є застосування графових баз даних та алгоритмів машинного навчання, що дає змогу об'єднувати дані з різних джерел (пацієнти, пристрої, записи) в єдину онтологічну модель, що забезпечує автоматизоване виявлення залежностей у даних про медико-біологічний об’єкт, а також надаєінструменти для прогнозування стану програмно-апаратного забезпечення цифрового двійника. Удосконалено теоретичні засади оброблення просторово-часових параметрів медико-біологічного об’єкта для побудови його цифрового двійника, що полягає у застосуванні тривимірних згорткових нейронних мереж (3D-CNN) та рекурентних архітектур для оброблення відео- та аудіоданих та, на відміну від відомих підходів, дає змогу забезпечити комплексний аналіз динамічних змін структури та функціонування медикобіологічного об’єкта з врахуванням його індивідуальних анатомічних особливостей та динаміки. Уперше розроблено архітектурні шаблони проєктування для розроблення програмних систем на основі цифрових двійників медикобіологічних об’єктів, які, на відміну від відомих, орієнтовані на оперування складними наборами мультимодальних темпоральних даних, інтегрованих у єдину семантичну модель, що дає змогу спростити процес розроблення, обслуговування та масштабування медичних програмних систем. Основні наукові результати дисертаційної роботи опубліковано у наукових працях, зокрема у 4 наукових статтях, опублікованих у фахових виданнях, включених до переліку наукових фахових видань України з присвоєнням категорії «Б», та у 2 матеріалах наукової конференції.
Відкритий доступ
Алгоритмічне та програмне забезпечення технології цифрових двійників мульсемедійних об’єктів
(КПІ ім. Ігоря Сікорського, 2024) Рвач, Дмитро Вячеславович; Сулема, Євгенія Станіславівна
Рвач Д. В. Алгоритмічне та програмне забезпечення технології цифрових двійників мульсемедійних об’єктів. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії в галузі знань 12 Інформаційні технології за спеціальністю 121 Інженерія програмного забезпечення. – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2024. Цифрові двійники є технологією, що надають змогу створити цифрову копію фізичного об’єкту для подальшого аналізу та симуляції його поведінки. Технологія цифрових двійників пропонує новий підхід до представлення та обробки динамічної цифрової моделі фізичного об'єкта або процесу, його минулого, теперішнього і майбутніх станів та поведінки. Цифровий двійник являє собою сукупність віртуальних інформаційних структур, які повністю описують майбутній або реально існуючий фізичний об'єкт від мікрорівня (одноелементний рівень) до макрорівня (загальний вигляд, загальні властивості об'єкта в цілому). Технологія цифрових двійників сполучає конкретну фізичну систему із комп'ютерною моделлю, яка відображає архітектуру, динаміку і фактичний стан цієї конкретної системи. Давачі, що дозволяють здійснювати безперервний моніторинг об’єкта, можуть бути використанні як джерела інформації для створення таких індивідуалізованих динамічних моделей. Аналіз існуючих програмних систем для роботи з цифровими двійниками показує, що вони є вузькоспрямованими на створення цифрових двійників специфічних об’єктів для конкретної галузі та не здатні використовувати більш універсальний підхід до створення цифрової копії реального об’єкту. Також значною мірою виявлена проблема відсутності уніфікації та стандартизації форматів обміну даними між фізичною та цифровою копією об’єкта. Розв’язання цих завдань можливе шляхом створення уніфікованої, гнучкої та стандартизованої програмної системи, що надає змогу створювати цифрові копії фізичних об’єктів з різними параметрами і налаштувати роботу з ними згідно з вимогами. Технологію цифрових двійників звичайно використовують у галузі виробництва та у інженерії. Натомість, практично немає прикладів застосування цієї технології у галузі освіти та у медичній галузі. Тим не менш, застосування технології цифрових двійників у цих галузях має великий потенціал, оскільки за рахунок її використання можна досягти нової якості освіти та медичних послуг. Проте, для адаптації технології цифрових двійників до вимог цих галузей, особливостю яких є безпосередня участь людини у процесах, процедурах та сервісах, доцільно враховувати новітні технічні можливості, що спрямовані на цифрову обробку даних про фізичні властивості об’єктів навколишнього світу, які здатна сприймати людина. Тому актуальною задачею є розширення технології цифрових двійників за рахнок застосування концепції мульсемедіа, яка робить можливим сворення нових інтерфейсів людиномашинної взаємодії. Описані завдання та тенденції визначають актуальну науковотехнічну задачу вдосконалення та розвитку теоретичних основ створення алгоритмічного та програмного забезпечення технології цифрових двійників, що вирішується у цій дисертаційній роботі. Метою дисертаційної роботи є підвищення ефективності обробки даних про стан мульсемедійних об’єктів у програмних системах на основі концепції цифрового двійника. У першому розділі дисертаційної роботи проаналізовано методи, підходи та програмне забезпечення для обробки даних цифрових двійників мульсемедійних об’єктів. Досліджено технологію цифрових двійників та концепцію мульсемедіа. Вивчено поточний стан наявних програмних систем на основі технології цифрових двійників. Виявлено недостатню універсальність підходів до створення цифрового двійника у вказаних програмних системах. У результаті визначено функціональні та нефункціональні вимоги для цього класу програмного забезпечення. У другому розділі розроблено алгоритмічне та програмне забезпечення процесів консолідації мульсемедійних даних на основі концепції мультиобразу. Запропоновано метод консолідації мульсемедійних даних, який передбачає обробку мульсемедійних даних з використанням алгебраїчної системи агрегатів. Запропоновано розширення формату JSON для створення синхронізованої у часі структури мульсемедійних даних – TJSON. Використано дискретні вейвлет-перетворення та алгоритми стеганографії для поєднання даних різних модальностей в єдиний цифровий об’єкт. Запропоновано використання паралельних обчислень для підвищення ефективності реалізації запропонованого методу. У третьому розділі розглянуто наявні підходи до обробки даних про мульсемедійні об’єкти, один з яких ґрунтується на застосуванні мови програмування ASAMPL. Запропоновано шляхи вдосконалення мови програмування ASAMPL, а саме: оновлено синтаксис, що надало можливість поліпшити метрики коду при програмуванні мовою ASAMPL; уведено нові програмні конструкції, що розширило можливості мови, зокрема, зробило можливим застосування паралельних обчислень. Зазначені зміни включені до нової версії мови програмування – ASAMPL 2.0. Також запропоновано специфічні шаблони проєктування, що уніфікують та стандартизують підходи до роботи з мульсемедійними об’єктами. Четвертий розділ присвячено розробленню узагальненої архітектури програмних систем для обробки даних цифрових двійників мульсемедійних об’єктів. На основі запропонованої узагальненої архітектури розроблено архітектуру цифрового двійника пацієнта, яка призначена для використання у медичних програмних системах, та архітектуру програмної системи для тренінгів фахівців, чия професійна діяльність пов’язана з підвищеним ризиком. У дисертаційній роботі отримано низку нових наукових результатів, зокрема уперше запропоновано метод консолідації мульсемедійних даних, характерними рисами якого є застосування: концепції мультиобразу, кількісних відношень дискретних інтервалів, операцій алгебраїчної системи агрегатів, принципів стеганографії, дискретного вейвлет-перетворення, паралельних обчислень, що робить можливим поєднання даних різних модальностей в єдиний цифровий об’єкт. Удосконалено теоретичні засади обробки темпоральних мультимодальних даних, які полягають у тому, що запропоновані кількісні відношення дискретних інтервалів, які на відміну від відношень інтервальної алгебри Аллена та відношень дискретних інтервалів в алгебраїчній системі агрегатів, дають змогу встановлювати кількісні темпоральні властивості наборів даних різних модальностей. Уперше запропоновано узагальнену архітектуру програмної системи для обробки даних цифрових двійників мульсемедійних об’єктів, характерними рисами якої є оперування наборами темпоральних мультимодальних даних, які представлені як комплексна структура даних – мультиобраз мульсемедійного об’єкта, та забезпечення взаємодії з мульсемедійним об’єктом через спеціалізовані програмно-апаратні засоби (сенсори, актуатори, симулятори, рендери), що спрощує процеси розроблення нового покоління програмних систем на основі концепції цифрових двійників – мульсемедійного програмного забезпечення. Уперше запропоновано архітектурні шаблони проєктування, які, на відміну від відомих, призначені для оперування комплексними структурами мульсемедійних даних – мультиобразами мульсемедійних об’єктів, що спрощує процеси розроблення мульсемедійного програмного забезпечення. Основні наукові результати дисертаційної роботи опубліковано у 8 наукових працях, зокрема у 4 наукових статтях опублікованих у фахових виданнях, включених до переліку наукових фахових видань України з присвоєнням категорії «Б», та у 4 матеріалах наукових конференцій.
Відкритий доступ
Алгоритмічне та програмне забезпечення захисту приватних наборів даних у задачах класифікації
(КПІ ім. Ігоря Сікорського, 2024) Северін, Андрій Іванович; Онай, Микола Володимирович
Северін А. І. Алгоритмічне та програмне забезпечення захисту приватних наборів даних у задачах класифікації. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії в галузі знань 12 Інформаційні технології за спеціальністю 121 Інженерія програмного забезпечення. – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2024. Впровадження систем аналізу даних і штучного інтелекту набуває все більшого поширення у різних аспектах людського життя. Окрім вже звичних випадків застосування таких систем у електронній комерції (наприклад, підбір рекомендацій користувачеві) та соціальній сфері (виявлення спаму, модерування коментарів), такі інструменти стрімко поширюються й для персонального використання (наприклад, чатботи ChatGPT, Google Bard, Microsoft Copilot, хоча вони з’явились лише впродовж останніх двох років). В основі систем, що використовують методи машинного навчання, лежать дані. Вони є необхідним елементом як для навчання систем аналізу даних і штучного інтелекту, так і для їх тестування. Чим більше різнопланових даних, аналізується, тим точнішою є побудована програмна система. Найчастіше джерелом даних для програмних рішень з використанням машинного навчання є реальний світ. Іноді дані генерують програмним шляхом, намагаючись відтворити певні характеристики даних. Проте, незважаючи на те, що кількість створюваних та оброблюваних даних стрімко зростає, дані досить часто містять щонайменше частину приватної інформації, що обмежує їх використання для систем аналізу даних і штучного інтелекту. Приватні дані – інформація, яка є конфіденційною, чутливою або секретною. Прикладами секретних даних є військові, фінансові та державні дані. Конфіденційні дані – дані, що дозволяють ідентифікувати людину або компанію, їх прикладами є серія та номер паспорту, реєстраційний податковий номер та номер автомобіля. Прикладами чутливих даних є дані, що містять медичні діагнози пацієнтів. Збереження приватності даних є вкрай важливим, адже втрата приватності може призвести до дуже негативних наслідків (передусім різноманітних злочинів та недобросовісної конкуренції). Таким чином, вище описані задачі визначають актуальну науковотехнічну задачу вдосконалення алгоритмічного та програмного забезпечення захисту приватних наборів даних у системах з використанням штучного інтелекту, яка вирішується у даній дисертаційній роботі для задачі класифікації. Метою дисертаційної роботи є удосконалення процесу оброблення приватних наборів даних для програмних систем інтелектуального аналізу даних. У першому розділі дисертаційної роботи розглянуто основні етичні аспекти використання систем штучного інтелекту та проблеми до яких може призвести їх ігнорування. Проаналізовано загрози приватності у таких системах, зокрема атаки інверсії, отруєння та логічного висновку. Проведено комплексний порівняльний аналіз методів збереження приватності в машинному навчанні (методи генерації синтетичних даних, анонімізації даних, диференційної приватністі, гомоморфного шифрування та федеративного навчання), що дозволило виявити основні проблеми існуючих методів, які потребують досліджень. Розроблено вимоги до програмного забезпечення захисту приватних наборів даних у задачах класифікації. У другому розділі розроблено алгоритмічні методи міжбазисних перетворень елементів скінченних полів. Проаналізовано особливості використання полів Галуа в гомоморфних методах збереження приватності, а також визначено залежність часу виконання операцій над елементами скінченних полів від базису (поліноміального чи нормального), в якому представлені елементи. Запропоновано метод пошуку поліномів, який відрізняється від існуючого використанням простих чисел у десятковому представленні замість поліномів й дозволяє зменшити обчислювальну складність процесу пошуку нормальних многочленів. Розроблено модифікований спосіб для переходу між базисами, який полягає у використанні рекурентної формули, що дозволяє зменшити як кількість пам’яті, що використовується, так і обчислювальну складність. У третьому розділі розроблено алгоритмічно-програмний метод захисту приватних наборів даних. Проаналізовано математичне підґрунтя для побудови алгоритмічно-програмних методів з використанням нейронних мереж. Запропоновано метод функціонального шифрування даних, особливістю якого є можливість використання приватних наборів даних в загальнодоступних системах аналізу даних та штучного інтелекту шляхом зменшення їх розмірності й функціонального шифрування отриманих даних з використанням приватного ключа. Запропоновано модифікацію моделі шифрування даних, яка полягає у використанні двовимірних згорткових нейронних мереж і дозволяє застосовувати модель шифрування даних, що представлені набором пікселів, з яких складається зображення. Проаналізовано метрики для оцінки методів захисту наборів даних. Четвертий розділ присвячено розробленню програмного забезпечення реалізації запропонованих методів для захисту приватних наборів даних та проведенню експериментальних досліджень. Запропоновано архітектуру програмної системи для вирішення задачі класифікації на основі приватних даних. Розроблено програмну систему, яка дозволяє виконувати обчислення над елементами поля GF(pm), проводити експериментальні дослідження, використовуючи поліноміальне й нормальне представлення елементів поля GF(pm), задавати різні значення вхідних параметрів p та m, а також генерувати різні набори тестових даних залежно від нормальних поліномів поля Галуа. Проведено експериментальні дослідження запропонованих методів міжбазисних перетворень скінченних полів. Розроблено програмну систему вирішення задачі класифікації на приватних наборах даних, що реалізує метод функціонального шифрування для захисту приватних наборів даних й дозволяє вирішувати задачу класифікації, використовуючи як оригінальні дані, так і зашифровані. Проведено експериментальні дослідження запропонованого методу функціонального шифрування. Проаналізовано шляхи інтеграції розроблених програмних систем. У дисертаційній роботі отримано низку нових наукових результатів, зокрема уперше запропоновано архітектуру програмної системи для вирішення задачі класифікації на основі приватних даних, характерною особливістю якої є захист приватних наборів даних, шляхом функціонального шифрування, що відбувається на стороні клієнта, і дозволяє збільшити кількість наборів даних для навчання загальнодоступних систем аналізу даних і штучного інтелекту. Уперше запропоновано модифікацію програмної моделі шифрування даних, яка відрізняється від існуючої використанням двовимірних згорткових нейронних мереж, замість одновимірних, і дозволяє застосовувати модель шифрування з використанням нейронних мереж до даних, що представлені набором пікселів, з яких складається зображення. Уперше розроблено алгоритмічно-програмний метод функціонального шифрування наборів даних, особливістю якого є можливість використання приватних наборів даних в загальнодоступних системах аналізу даних та штучного інтелекту шляхом зменшення їх розмірності й функціонального шифрування отриманих даних з використанням приватного ключа. Уперше розроблено алгоритмічно-програмний метод пошуку нормальних поліномів серед незвідних, який відрізняється від існуючого використанням простих чисел у десятковому представленні замість поліномів, що дозволяє зменшити обчислювальні витрати алгоритму пошуку незвідних многочленів з O(n3) до O(n log(log n)) і, як наслідок, спростити міжбазисні перетворення у бінарних скінченних полях з метою пришвидшення виконання операцій над елементами поля у методах гомоморфного шифрування даних. Уперше розроблено модифікований спосіб побудови матриці переходу між поліноміальним та нормальним базисами скінченного поля, який полягає у використанні рекурентної формули замість обчислення остачі від ділення елемента на незвідний поліном, що дозволяє зменшити кількість використовуваної пам’яті з до n · p, а також обчислювальну складність з до . Основні наукові результати дисертаційної роботи опубліковано у 7 наукових працях, зокрема у 4 наукових статтях, включаючи 1 статтю опубліковану у закордонному аховому виданнях третього квартиля (Q3), яке проіндексоване в базі даних Scopus, 1 статтю опубліковану у виданні, яке проіндексоване в базі даних Web of science, і 2 статті опубліковані у фаховому виданні, включеному до переліку наукових фахових видань України з присвоєнням категорії «Б» та у 3 матеріалах науково-технічних конференцій.
Відкритий доступ
Алгоритмічне та програмне забезпечення процесів автоматичної ідентифікації на основі багатоколірних завадостійких штрихових кодів у медичних інформаційних системах
(КПІ ім. Ігоря Сікорського, 2023) Дичка, Андрій Іванович; Сулема, Євгенія Станіславівна
Дисертація на здобуття наукового ступеня доктора філософії в галузі знань 12 Інформаційні технології за спеціальністю 121 Інженерія програмного забезпечення. – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2023. Автоматична ідентифікація є технологією введення інформації в систему обробки шляхом сканування спеціальної позначки, нанесеної на поверхню об’єкта обліку. Введення даних на основі штрихового кодування інформації є одним з найпоширеніших видів автоматичної ідентифікації, перевагами якої є висока швидкість та точність введення даних в обчислювальну систему. Технологію штрихового кодування інформації використовують в різноманітних галузях, її застосування є актуальним і для медичної галузі. З розвитком інформаційних технологій постає задача інформатизації медичної галузі. Цифрова медицина є важливим компонентом суспільного життя. Однією з важливих складових електронної охорони здоров’я є медичні інформаційні системи. Медична інформаційна система є програмно-технічним комплексом, використання якого дозволяє підвищити ефективність функціонування медичної установи та поліпшити організацію обслуговування пацієнтів. Аналіз існуючих медичних інформаційних систем показує, що недостатнім є ступінь автоматизації процесів при наданні медичних послуг; необхідно посилити захист та цілісність персональних і медичних даних пацієнтів, автоматизувати для пацієнта доступ до власних медичних даних тазабезпечити електронну візуально-захищену взаємодію лікаря та пацієнта з використанням мобільних пристроїв. Вирішення цих завдань можливе за рахунок використання в медичній інформаційній системі багатоколірного штрихового кодування інформації, яке дозволяє у декілька разів підвищити інформаційну щільність штрихкодових позначок порівняно з чорно-білими штриховими кодами. Окреслені завдання та тенденції розвитку цифрової медицини визначають актуальну науково-технічну задачу вдосконалення та розвитку теоретичних основ створення алгоритмічного та програмного забезпечення процесів автоматичної ідентифікації у медичних інформаційних системах на основі багатоколірного завадостійкого штрихового кодування персональних та медичних даних пацієнтів з використанням мобільних пристроїв, яка вирішується в цій дисертаційній роботі. Метою дисертаційної роботи є удосконалення технології розроблення спеціалізованого класу прикладного програмного забезпечення у складі медичних інформаційних систем на основі автоматичної ідентифікації об’єктів медичного документування з використанням багатоколірного завадостійкого штрихового кодування інформації. У першому розділі дисертаційної роботи проаналізовано алгоритмічнопрограмні рішення для автоматичної ідентифікації в медичних інформаційних системах. Вивчено сучасний стан програмного забезпечення в медичній галузі, зокрема спеціалізовані програмні продукти для різних секторів медицини, а також програмні рішення, пов’язані із застосуванням мобільних пристроїв для охорони здоров’я. Досліджено особливості багатоколірного штрихового кодування інформації. Це дозволило сформувати вимоги до розроблення архітектури програмної системи, яка б надавала пацієнтам додаткові можливості щодо автоматизованого доступу до своїх медичних даних на основі багатоколірного штрихового кодування інформації. У другому розділі розроблено алгоритмічне та програмне забезпечення процесів створення багатоколірних завадостійких штрихкодових знаків як мінімальних структурних одиниць штрихкодового зображення. Запропоновано створювати штрихкодові знаки так, щоб вектор (цифровий еквівалент) кожного штрихкодового знака був кодовим словом многозначного коректувального коду Хемінга або БЧХ. Розроблено метод синтезу символіки заданої потужності та колірності завадостійкого штрихового коду для реалізації в медичній інформаційній системі на основі багатоколірного штрихового кодування інформації. У третьому розділі розроблено алгоритмічне та програмне забезпечення завадостійкості багатоколірних штрихових кодів у медичних інформаційних системах. Запропоновано метод підвищення завадостійкості багатоколірних штрихових кодів, який грунтується на застосуванні дворівневого контролю ушкоджень з використанням двох многозначних коректувальних кодів: коду, який виправляє одно- або двократні ушкодження у межах штрихкодового знака, та коду Ріда-Соломона – на рівні усієї штрихкодової позначки. Четвертий розділ присвячено удосконаленню технології проєктування програмного забезпечення процесів автоматичної ідентифікації у медичних інформаційних системах на основі багатоколірного завадостійкого штрихового кодування інформації. На основі аналізу та пріоритизації функціональних вимог розроблено архітектуру програмного забезпечення у складі медичної інформаційної системи, характерною особливістю якої є застосування багатоколірного штрихового кодування для автоматичної ідентифікації об’єктів медичного документування. Запропоновано організацію моніторингу функціонування програмного забезпечення у складі медичної інформаційної системи на основі метрик. У дисертаційній роботі отримано низку нових наукових результатів, зокрема уперше запропоновано архітектуру програмної системи як ядро медичної інформаційної системи, характерною рисою якої є забезпечення багатоколірного завадостійкого штрихового кодування персональних даних пацієнтів та розподіленого зберігання мультимодальних медичних даних, що дозволяє: забезпечити швидке і безпомилкове введення даних пацієнта, гарантувати цілісність даних, а також спростити процеси створення програмного забезпечення для галузі охорони здоров’я нового покоління – медичних інформаційних систем з автоматичною ідентифікацією об’єктів медичного документування. Уперше розроблено метод синтезу символіки (множини штрихкодових знаків) заданої потужності та колірноcті завадостійкого штрихового коду для реалізації у медичній інформаційній системі на основі багатоколірного штрихового кодування інформації, який грунтується на тому, що цифрові еквіваленти (вектори) багатоколірних штрихкодових знаків символіки є кодовими словами многозначного коректувального коду, здатного виправляти одно- або двократні помилки (ушкодження) в межах кожного штрихкодового знака, що при зчитуванні (скануванні) з носія штрихкодових знаків – як структурних одиниць багатоколірного штрихкодового зображення, забезпечує достовірне відтворення даних або виявлення значної частини багатократних ушкоджень елементів штрихкодового знака, і таким чином утворює нижній рівень забезпечення завадостійкості багатоколірних штрихкодових зображень (рівень штрихкодових знаків). Уперше розроблено метод підвищення завадостійкості багатоколірних штрихових кодів при їх використанні в медичній інформаційній системі, який грунтується на застосуванні дворівневого контролю ушкоджень (спотворень), що виникають при скануванні багатоколірного штрихкодового зображення, з використанням двох многозначних коректувальних кодів: коду, який виправляє одно- або двократні ушкодження – на рівні штрихкодових знаків (нижній рівень), та коду Ріда-Соломона – на рівні усієї штрихкодової позначки (верхній рівень), та полягає в тому, що особливістю застосування многозначного коректувального коду на нижньому рівні контролю ушкоджень є те, що цифровий еквівалент (вектор) багатоколірного штрихкодового знака має бути кодовим словом цього коректувального коду, а особливістю застосування многозначного коректувального коду на верхньому рівні контролю ушкоджень є те, що він має виправляти спотворення двох видів – помилки та стирання, де факт виявлення багатократного ушкодження елементів штрихкодового знака на нижньому рівні контролю кваліфікується на верхньому рівні контролю як стирання, що, завдяки удвічі меншому витрачанні ресурсу в коді Ріда-Соломона на виправлення стирання порівняно з виправленням помилки, дозволяє істотно поліпшити завадостійкість штрихкодових позначок: при застосуванні на нижньому рівні контролю многозначного коду БЧХ – на (35 - 45)%, а многозначного коду Хемінга – на (12 - 25)%. Удосконалено теоретичні засади розроблення вимог до проєктованого програмного забезпечення, які полягають у тому, що на відміну від існуючого підходу до визначення пріоритетності функціональних вимог якісними (нечисловими) показниками – “ключова”, “необхідна”, “бажана” тощо, запропоновано - на основі п’яти числових критеріїв (“вигода”, “втрата”, “вартість”, “ризик”, “близькість вигоди”), яким присвоюють числові значення з діапазону 1…10 на основі їх експертного оцінювання, кількісно визначати загальний пріоритет вимоги шляхом формульного обчислення, що дозволяє упорядковувати вимоги за спаданням пріоритету та на цій підставі ефективно планувати та розподіляти роботи між командами виконавців з урахуванням їх кваліфікації та кількісного складу, а також виконувати поквартальне планування робіт з розроблення програмного забезпечення. Основні наукові результати дисертаційної роботи опубліковано у 7 наукових працях, зокрема у 5 наукових статтях, з яких 1 статтю опубліковано у виданні, включеному до переліку наукових фахових видань України з присвоєнням категорії «А», і 4 статті опубліковано у фахових виданнях, включених до переліку наукових фахових видань України з присвоєнням категорії «Б», та у 2 матеріалах наукових конференцій. Ключові слова: прикладне програмне забезпечення, архітектура програмного забезпечення, медичні інформаційні системи, автоматична ідентифікація, багатоколірне штрихове кодування, цифрова медицина.
Відкритий доступ
Методи та програмні засоби метаморфічного тестування програмних систем автоматичної кластеризації природномовних текстових даних
(КПІ ім. Ігоря Сікорського, 2022) Юсин, Яків Олексійович; Заболотня, Тетяна Миколаївна
Відкритий доступ
Алгоритмічне та програмне забезпечення процесів автоматичної ідентифікації об’єктів логістики на основі штрихових кодів з трьома градаціями кольору
(2021) Сулема, Ольга Костянтинівна; Дичка, Іван Андрійович
Відкритий доступ
Алгоритмічне та програмне забезпечення систем захисту мультимедійних даних користувачів мережі інтернет
(2020) Радченко, Євген Олександрович; Сулема, Євгенія Станіславівна
Відкритий доступ
Методи, моделі та засоби обробки мультимодальних даних цифрових двійників досліджуваних об’єктів
(2020) Сулема, Євгенія Станіславівна; Дичка, Іван Андрійович
Відкритий доступ
Методи та засоби підвищення ефективності реалізації обчислювальних операцій у скінченних полях
(2017) Онай, Микола Володимирович; Дичка, Іван Андрійович

Переглянути

Нові надходження