Дисертації (ІПІ)

Постійне посилання зібрання

У зібранні розміщено дисертації, які захищені працівниками кафедри.

Переглянути

Нові надходження

Зараз показуємо 1 - 7 з 7
  • ДокументВідкритий доступ
    Методи та програмне забезпечення розмітки відеоданих для задач комп’ютерного зору
    (КПІ ім. Ігоря Сікорського, 2025) Зарічковий, Олександр Анатолійович; Стеценко, Інна Вячеславівна
    Штучний інтелект є однією з найбільш поширених сфер розробок програмного забезпечення у сучасному світі інформаційних технологій. За останню декаду було досягнуто значного прогресу для задач комп'ютерного зору, зокрема, у детекції об’єктів, завдяки розвитку методів глибокого навчання та зростанню обчислювальних можливостей. Для успішної розробки та впровадження програмних засобів на основі ШІ необхідно збирати та розмічати великі об’єми даних, що вимагає значних людських ресурсів та часу. Неякісна розмітка даних може призвести до неточних та помилкових результатів методів ШІ, що в свою чергу стає причиною помилок у результатах обчислень програмного забезпечення. Наявні інструменти розмітки даних не завжди відповідають потребам розробників програмного забезпечення з використанням ШІ, особливо в контексті роботи з великими об'ємами відеоданих, що збільшує трудовитрати процесу створення якісних наборів даних. Наявність зазначених проблем визначає актуальне наукове завдання підвищення ефективності процесу розмітки відеоданих для задач комп’ютерного зору, яке вирішується у цій дисертаційній роботі. Метою дисертаційної роботи є підвищення швидкості розмітки відеоданих у контексті завдань детекції об'єктів за рахунок вдосконалення методів та програмного забезпечення, призначеного для розмітки відеоданих. Для досягнення мети в роботі досліджено методи навчання нейронних мереж, що підвищують точність детекції об’єктів без змін моделей чи збільшення їх параметрів, та підходи до зменшення обсягу кадрів, які обробляються в задачах комп’ютерного зору. Проведено аналіз візуально-мовних моделей для підвищення точності програмних рішень, а також сучасних інструментів і процесів розмітки зображень та відео з метою вдосконалення їх архітектури та пришвидшення обчислень. Розроблено дуальну архітектуру автоматизованої розмітки даних та програмне забезпечення, що її реалізує. Проведено експериментальне дослідження, яке доводить ефективність прийнятих рішень. Одним із головних викликів на шляху досягнення мети є забезпечення високої якості автоматизованої розмітки даних, наслідком якої є зменшення відсотку помилок, які необхідно виправити розмітчиком (людиною). Для розв'язання цього завдання застосовані різні техніки та методи, включаючи вперше запропоновану дуальну архітектуру, метод пріоритезації даних, ітеративний метод вибору ключових кадрів та мультимодальні нейронні мережі. Основним результатом роботи є створення дуальної архітектури програмного забезпечення для автоматизації розмітки даних та імплементація методів автоматичної розмітки відеоданих, які забезпечують високу точність розмітки та скорочення часу, необхідного для дорозмітки (уточнення розмітки, які виконуються розмітчиком після автоматизованої розмітки). Розроблені методи перевірені на реальних задачах з метою демонстрації їхньої ефективності та переваг. У першому розділі розглянуто основні аспекти детекції об'єктів, розмітки даних для задач комп'ютерного зору та програмні засоби для розмітки відеоданих. Зроблено огляд різних методів детекції об'єктів, у тому числі відомі методи, такі як R-CNN, Fast R-CNN, YOLO та інші. Описано процес розмітки даних та її значення для ефективного вирішення завдань машинного навчання. Наведено особливості розмітки даних для задач детекції об’єктів та постановлено задачу дослідження. 4 У другому розділі представлено новий метод навчання моделей машинного навчання, який використовує пріоритезацією складних екземплярів даних для навчання нейронних мереж, що збільшує точність детекції об’єктів на відео за рахунок підвищення якості набору даних. Особливістю запропонованого методу є те, що він не потребує попередньої розмітки відео для вибору складних екземплярів. У третьому розділі запропоновано новий ітеративний метод вибору ключових кадрів на довгих відео для узагальнення змісту відео. Запропонований метод зменшує кількість нерелевантних кадрів, які визначені на фазі попереднього відбору, шляхом ітеративного застосування моделі машинного навчання до відібраних кадрів з подальшою фільтрацією нерелевантних кадрів та сегментів. У четвертому розділі представлено метод агрегації знань Attr Vis, який спрямований на покращення використання знань, закодованих у великих лінгвістичних моделях (LLM) та мовних модальностях візуально-мовних моделей (VLM), для підвищення точності розпізнавання складних сцен на відео за рахунок генерації додаткових атрибутів по відео. Новизна підходу полягає у генерації атрибутів на невеликих сегментах відео, що дозволяє ефективно кодувати зміни атрибутів з часом та підвищує точність розпізнавання подій. Також було запропоновано новий алгоритм розширення лексикону, призначений для збільшення спектра атрибутів, пов’язаних з відеоданими, що підвищує точність опису подій текстовою моделлю. У п’ятому розділі проведено огляд інструментів розмітки зображень, визначено критерії для їх оцінки та наведено детальний огляд конкретних інструментів, таких як V7, LabelBox, Keylabs, LabelImg, LabelMe, Label Studio та Computer Vision Annotation Tool (CVAT). Розглянуто архітектуру інструменті розмітки CVAT, підходи автоматизації процесу розмітки даних та визначено вимоги до програмного забезпечення. Запропоновано дуальну архітектуру програмного забезпечення для автоматизації розмітки відеоданих, описано ключові компоненти системи та їх взаємодію. Наведено опис архітектури та основних її компонентів. Розроблено програмне забезпечення на базі запропонованої архітектури та методів. У шостому розділі наведено опис набору даних для проведення експериментального дослідження, визначено задачі розмітки даних, детально описано організацію процесу розмітки, інших умов проведення експерименту та наведені результати експериментального дослідження. Подано результати оцінювання швидкості та якості виконання розмітки відеоданих без автоматизації та з використанням різних підходів, включаючи нульове та активне навчання, а також підхід з використанням запропонованої дуальної архітектури. Виконано порівняння різних підходів до автоматизації розмітки відеоданих. Зроблені висновки щодо досягнення поставленої мети дисертаційної роботи. У дисертаційній роботі отримано низку нових наукових результатів: - вперше запропоновано дуальну архітектуру програмного забезпечення для автоматизованої розмітки даних, яка, за рахунок методу адаптивноагрегованого навчання нейромережі, забезпечує пришвидшення процесу розмітки та, на відміну від існуючих аналогів, дає змогу ефективного застосування нульового та активного навчання нейромережі для розмітки даних та більш гнучкого використання програмного забезпечення для різноманітних задач комп’ютерного зору; - вперше запропоновано метод пріоритезації складних зразків для навчання нейронної мережі, який, за рахунок відбору найскладніших зразків для навчання, підвищує якість набору даних без проведення попередньої розмітки відео, внаслідок чого збільшується точність детекції об’єктів на відео, та, на відміну від існуючих підходів, базується виключно на автоматично згенерованій репрезентації даних; - вперше запропоновано ітеративний метод вибору ключових кадрів на довгих відео, що дає змогу визначати ключові кадри та сегменти відео з поступовим підвищенням точності, та, на відміну від існуючих методів, враховувати динамічно зміни контенту відео для вибору ключових кадрів, підвищуючи точність сегментації та зменшуючи обсяг відеоданих для обробки; - вперше запропоновано метод агрегації знань між текстовою та візуальною частинами у візуально-мовній моделі (VLM) для обробки складних мультимодальних взаємодій, що забезпечує більш високу точність розпізнавання складних сцен на відео та їх опису у порівнянні з існуючими аналогами. Основні результати дисертаційної роботи опубліковано у 6 публікаціях, з яких 4 статті в періодичних виданнях, що проіндексовано у базі даних Scopus, 1 публікація опублікована у фаховому виданні, включених до переліку наукових фахових видань України з присвоєнням категорії «Б», та 1 публікація у матеріалах міжнародної наукової конференції.
  • ДокументВідкритий доступ
    Методи і програмні засоби підвищення ефективності виконання запитів у високонавантажених системах
    (КПІ ім. Ігоря Сікорського, 2025) Белоус, Роман Володимирович; Крилов, Євген Володимирович
    Актуальність дослідження обумовлена стрімким зростанням обсягів даних та кількості запитів, що обробляються сучасними розподіленими інформаційними системами. Високонавантажені розподілені бази даних забезпечують обробку інформації в режимі реального часу, підтримуючи роботу широкого спектра застосувань – від соціальних мереж до корпоративних хмарних платформ. Однак, збільшення кількості та складності запитів створює значні труднощі у підтримці високої продуктивності та надійності. Зокрема, істотний вплив на ефективність мають мережеві затрати при передаванні даних між вузлами, коректне підтримання узгодженості даних та оптимальне розподілення навантаження. У дисертаційній роботі запропоновано науково-обґрунтовані методи та програмні засоби, що спрямовані на підвищення ефективності виконання запитів у високонавантажених розподілених системах. Для досягнення цієї мети було враховано потребу в оптимізації мережевого трафіку, вдосконаленні механізмів узгодженості даних та ефективному ребалансуванні ресурсів. Особливу увагу приділено оптимізації поведінки розподілених систем, що використовують алгоритми консенсусу Raft, оскільки саме в цих підходах закладено основу для надійного оновлення та синхронізації даних між множиною вузлів. Оптимізація Raft та пов’язаних з ним процесів передачі та узгодження даних дозволяє суттєво покращити час відгуку системи та знизити мережеве навантаження, що є критичним для стабільного функціонування високонавантажених застосувань. Вперше розроблено метод мінімізації обсягу мережевого трафіку у Raft Consensus Algorithm розподілених базах даних , який базується на поєднанні принципів, притаманних як Raft, так і Leaderless Replication та ґрунтується на 3 попередньому обміні метаданими між вузлами та в подальшому збережені отриманих результатів. Суть методу полягає в тому, що перед початком передавання основних даних, вузли спочатку обмінюються метаданими, які містять інформацію про стан кардинальності та вектори даних. Це дозволяє зменшити обсяг даних, що передаються через мережу, оскільки вузли можуть узгодити лише ті зміни, які дійсно потребують синхронізації. Після цього, на основі отриманих метаданих, відбувається локальне збереження результатів, що мінімізує кількість переданих даних, знижуючи тим самим навантаження на мережу та підвищуючи ефективність роботи алгоритму Raft у розподілених базах даних. Удосконалено метод оптимізації запитів у розподілених базах даних шляхом удосконалення ребалансування даних за допомогою генетичних алгоритмів з елітарністю та адаптивним схрещенням. Цей підхід дозволяє ефективніше розподіляти дані між вузлами системи, що зменшує час виконання запитів. Використання елітарності забезпечує збереження найкращих рішень на кожному етапі алгоритму, а адаптивне схрещення підвищує різноманітність рішень та прискорює конвергенцію до оптимального. У результаті, модифікований метод ребалансування сприяє підвищенню ефективності виконання запитів у розподілених базах даних, особливо в умовах високих навантажень. Удосконалено метод узгодженості даних у розподілених базах даних на основі методу Левенштейна, який відрізняється від існуючих підходів і мінімізує обсяг мережевого трафіку під час процесу узгодження даних, особливо при частих і малих змінах. Цей метод використовує вдосконалений метод Левенштейна, що дозволяє передавати тільки зміни замість повних копій даних. Завдяки цьому, значно зменшується кількість переданих даних по мережі, що особливо важливо в умовах частих оновлень і модифікацій невеликих обсягів текстов даних, забезпечуючи ефективну синхронізацію реплік і підтримуючи високу продуктивність системи. Для дослідження отриманих наукових результатів було розроблено спеціалізоване програмне забезпечення, яке являє собою електронний онлайнжурнал для студентів, викладачів, батьків та адміністрації навчальних закладів. 4 Цей програмний продукт дозволяє вчителям виставляти оцінки, створювати та призначати домашні завдання, а також вести звітність щодо успішності студентів. Студенти мають доступ до персонального кабінету, де відображається їхня академічна успішність, а батьки можуть отримувати доступ до інформації, що стосується їхньої дитини, включаючи оцінки та завдання. Адміністрація навчального закладу, у свою чергу, може генерувати різноманітні звіти та статистику щодо успішності студентів та інших показників. Для забезпечення ефективності, надійності та масштабованості застосунок було побудовано на основі Raft¬архітектури, яка гарантує узгодженість даних у розподіленій системі. Застосунок реалізовано з використанням сучасного стека технологій, включаючи Docker, Laravel та Vue.js. Застосування цих технологій дозволило створити гнучку, стійку до помилок і легко масштабовану систему, яка ефективно підтримує всі необхідні функції та забезпечує можливість дослідження і аналізу наукових результатів у контексті роботи розподілених систем. Дисертаційна робота складається зі вступу, 5 розділів, загальних висновків, списку використаних джерел із 47 найменувань та 2 додатків. Загальний обсяг дисертації становить 152 сторінок, з яких 126 сторінки основного тексту, містить 45 рисунків та 6 таблиць.
  • ДокументВідкритий доступ
    Методи та програмні засоби аналізу блокчейн транзакцій
    (КПІ ім. Ігоря Сікорського, 2024) Колісніченко, Вадим Юрійович; Дорогий, Ярослав Юрійович
    Колісніченко В. Ю. Методи та програмні засоби аналізу блокчейн транзакцій. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії з галузі знань 12 Інформаційні технології за спеціальністю 121 Інженерія програмного забезпечення. – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2024. Дисертаційна робота присвячена розробці методів та засобів для аналізу блокчейн транзакцій. Розроблені методи можуть бути прямо або опосередковано застосовані як при аналізі транзакцій, так і для дослідження блокчейн мереж загалом. Аналіз блокчейн мереж, а саме блокчейн транзакцій, є важливою задачею в блокчейн індустрії. У цьому контекстізосередження уваги на блокчейн транзакціях є не лише академічним інтересом але й практичною необхідністю для забезпечення безпеки, ефективності та стійкості мережі. Розробники постійно працюють над відлагодженням роботи блокчейнвузлів, що є надзвичайно важливим для підтримки надійності мережі. Це включає в себе не тільки виявлення та усунення помилок у коді, а й оптимізацію продуктивності та масштабованості. В такому контексті аналіз транзакцій допомагає ідентифікувати та вирішувати проблеми, які можуть впливати на роботу вузлів. Дослідники використовують аналіз транзакцій для виявлення потенційно неефективних місць у мережі. Це включає в себе вивчення шаблонів трафіку, обробку запитів, а також аналіз затримок і пропускної здатності. Такий аналіз може виявити вузькі місця, що потребують оптимізації, або навіть передбачити потенційні проблеми, які можуть виникнути в майбутньому. Виявлення вразливостей через аналіз блокчейн транзакцій є важливим як для забезпечення безпеки мережі, так і для дослідження минулих атак. Це охоплює відстеження підозрілих або нестандартних транзакцій, що може вказувати на спроби шахрайства, викрадення коштів, атаки типу "відмова в обслуговуванні" (DoS) або інші безпекові загрози. Аналіз транзакцій стає ключовим інструментом у боротьбі з кіберзлочинністю та забезпеченні довіри до блокчейн технологій. Метою дисертаційної роботи є підвищення ефективності програмних засобів аналізу блокчейн транзакцій за рахунок удосконалення та розробки нових методів аналізу. У першому розділі дисертаційної роботи проаналізовано засоби та методи дослідження блокчейн транзакцій. Розглянуто області застосування такого аналізу у різних сферах та виділено основні групи задач, які він намагається вирішити: зв’язування адреси з особою, аналіз великих потоків транзакцій та аналіз смартконтрактів. Проведено порівняльний аналіз сучасних систем аналізу блокчейн транзакцій, серед яких є блокчейн-провідники та комплексні платформи дослідження транзакцій. Проведено огляд існуючих методів аналізу та їх обмежень, які вирішуються у даному дисертаційному дослідженні. У другому розділі розроблено алгоритмічне забезпечення для аналізу блокчейн транзакцій, а саме, розроблено чотири методи, які допомагають здійснювати аналіз транзакцій: метод застосування блокчейн-провідників для отримання даних з багатьох блокчейн мереж, метод виявлення та ідентифікації блокчейн вузлів, метод виявлення джерела транзакцій та метод аналізу OP_RETURN-скриптів. Третій розділ присвячено розробці архітектури комплексної системи аналізу блокчейн транзакцій, що здатна підтримувати різні типи блокчейн мереж та дозволяти вбудовувати додаткові компоненти аналізу. У розділі розглядається процес розроблення прототипів представлених методів та їх інтеграцію до комплексної аналітичної платформи. Четвертий розділ містить результати експериментального дослідження ефективності розроблених методів за допомогою реалізованих прототипів: методу застосування блокчейн-провідників для отримання даних з багатьох блокчейн мереж, методу виявлення та ідентифікації блокчейн вузлів, методу виявлення джерела транзакцій та методу аналізу OP_RETURN-скриптів. У дисертаційній роботі отримано низку нових наукових результатів, зокрема уперше розроблено архітектуру програмного забезпечення системи аналізу транзакцій блокчейн-мереж, яка відрізняється від існуючих застосуванням принципу інверсії керування, де компоненти аналізу окремих мереж ініціюють звʼязок та самостійно надсилають дані до ядра системи, що надає можливість інтеграції нових блокчейн-мереж та методів аналізу до системи. Вдосконалено метод отримання даних з блокчейн-мереж, який на відміну від наявних способів прямого отримання даних з вузлів передбачає застосування блокчейн-провідників, що надає можливість отримувати офчейн дані, які зберігаються провідником, а також уникнути розгортання власних блокчейн-вузлів під час аналізу різних мереж. Вперше здійснено формалізацію протоколу Peer Discovery блокчейн-мережі Rootstock на основі аналізу вихідного коду вузла RSKj, яка на відміну від інших включає та описує формати та послідовності повідомлень, що надає можливості для реалізації незалежних клієнтів мережі, подальшого аналізу та оптимізації даної децентралізованої системи. Вперше розроблено метод обходу вузлів блокчейн-мереж, який відрізняється від вже існуючих методів можливістю роботи з блокчейн-мережею Rootstock, що дозволяє шляхом її представлення у вигляді орієнтованого графа та послідовного опитування кожного нового виявленого вузла отримати усі доступні блокчейн вузли мережі Rootstock та її структуру. Вперше розроблено метод визначення відправника транзакцій у блокчейнмережі Rootstock через підключення до кожного знайденого вузла та аналізу часу отримання нових транзакцій, який на відміну від аналогічних методів враховує та використовує особливості мережі Rootstock, що надає можливість ідентифікувати вузол (отримати ідентифікатор та IP-адресу), який першим транслював транзакцію. Вдосконалено методологію аналізу транзакцій блокчейн-мережі Bitcoin, що на відміну від наявних підходів дозволяє автоматично виділяти різні типи OP_RETURN-скриптів на основі частоти появи їх префіксних частин та без попереднього знання форматів, що надає можливість розпізнавати та класифікувати дані, що зберігаються або протоколи, які побудовані з використанням OP_RETURN-скриптів. Запропоновані методи дозволяють підвищити ефективність аналізу блокчейн транзакцій у різних сферах, таких як розробка блокчейн систем, аудит смарт контрактів, розслідування злочинів пов’язаних з блокчейн мережами, трейдинг та інше. Основні результати дисертаційної роботи опубліковані у 4 наукових працях, зокрема, у 4 наукових статтях, з яких 2 статті опубліковано у 2 виданнях третього квартиля (Q3), які реферуються базою Scopus, 1 статті у виданні четвертого квартиля (Q4), який реферуються базою Scopus, та 1 стаття опублікована у науковому виданні, що входить до наукових фахових видань України. Запропоновані методи та прототипи впроваджені та використовуються розробниками блокчейн мережі Rootstock для аналізу динаміки вузлів та стану мережі та для аналізу безпеки.
  • ДокументВідкритий доступ
    Методи і програмні засоби для автоматизації управління роботизованою кінцівкою
    (КПІ ім. Ігоря Сікорського, 2024) Вітюк, Альона Євгеніївна; Дорошенко, Анатолій Юхимович
    Вітюк А.Є. Методи і програмні засоби для автоматизації управління роботизованою кінцівкою. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 121 «Інженерія програмного забезпечення». Робота виконана на кафедрі інформатики та програмної інженерії Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського» Міністерства освіти і науки України. Дисертацію присвячено дослідженню програмних засобів для управління роботизованою кінцівкою та методам автоматизації процесу їх розробки з використанням алгоритмів нейроеволюції. Класичні моделі програмних засобів для управління роботизованими кінцівками базуються на точних специфікаціях завдань і точних моделях цільових об’єктів, з якими взаємодіє робот. Такі підходи гарно працюють у лабораторних умовах, проте мають обмежену придатність в умовах реального світу. Нові програмні застосунки для управління роботизованими кінцівками повинні працювати з недосконалими датчиками та виконавчими механізмами. Розробка моделей управління роботизованою кінцівкою нового покоління має бути автоматизованою, адже завдання та робочі середовища для роботів ускладнюються, зростає потреба в методах навчання та пошуку, які можуть планувати досягнення цілі, не покладаючись на вже існуючу структуру підзадач, розроблену людиною. Таким чином, вказані задачі визначають актуальну науково-технічну задачу вдосконалення теоретичних (методів) та практичних (програмних засобів) основ автоматизованої розробки адаптивних моделей управління роботизованою системою з захватним пристроєм, яка вирішується у даній дисертаційній роботі. Метою дисертаційної роботи є підвищення ефективності розроблення програмного управління роботизованою рукою, яка отримує інформацію про стан середовища з камери, шляхом використання методів автоматизації створення нейроеволюційних моделей. Результати викладено у чотирьох розділах дисертації. Перший розділ присвячено огляду та аналізу проблем автоматизованого управління роботизованою рукою робота. Розглянуто особливості взаємодії агента та середовища. Запропоновано методи навчання інтелектуального роботизованого агенту для виконання задач маніпуляції цільовими об’єктами роботизованою рукою. Розглянуто програмні засоби для навчання нейроконтролерів роботизованих систем. Другий розділ присвячено огляду методів комп’ютерного зору для обробки візуальної інформації, яка може бути використана роботизованим агентом як вхідні дані стану середовища. Розглянуто залежність точності вхідних даних з візуального сенсора та якості позиціонування роботизованої системи. Запропоновано методи та програмні засоби для оцінки впливу похибок параметрів камери на якість реконструйованої моделі середовища. Третій розділ присвячено методам нейроеволюції для управління роботизованою системою з маніпулятором. Розглянуто алгоритм NEAT для автоматизації розробки нейроконтролерів для управління роботизованою кінцівкою. Розроблено навчальне середовище для автоматизованої розробки моделі позиціонування роботизованої руки. Представлено методи адаптації нейроеволюційного підходу до використання в цільових задачах роботизованої руки. В четвертому розділі розглядається розроблення програмного засобу для адаптивного навчання контролерів роборуки на основі нейромереж з використанням методів нейроеволюціїї для задач, де вхідні дані представлені у вигляді зображень з камери. Представлена реалізація програмного рішення для навчання роботизованої руки заданої конфігурації виконання задач у тренувальних середовищах. У дисертаційній роботі отримано низку нових наукових результатів, а саме: Вперше запропоновано метод пошуку новизни в нейроеволюції для автоматизації створення моделі програмного управління роботизованою кінцівкою, що дозволяє прискорити процес розробки системи управління для нових задач роботизованої кінцівки, зокрема для адаптації конфігурації кінцівки або середовища, що підтверджується за допомогою навчання у тестових середовищах та оцінки отриманої моделі. Представлений метод відрізняється від існуючих тим, що не потребує ресурсів розробника для ручного налаштування параметрів управління роботизованою кінцівкою з метою отримання найбільш ефективної стратегії вирішення кожної окремої задачі управління. Вперше запропоновано метод навчання на основі гіперкуба для програмного управління в задачах агента-роборуки, що отримує інформацію про стан середовища з камери. Використання методу на основі гіперкуба для програмного управління агентом на основі зображень з камери покращує ефективність навчання моделі за рахунок використання відображення геометрії фенотипу субстрату штучної нейронної мережі на його шаблон зв’язків на основі гіперкубу, сприяючи розвитку більш універсальних і потужних архітектур нейронних мереж. Вперше розроблено метод підвищення якості вхідних даних з камери, які використовуються для автоматизованого управління роботизованою кінцівкою, що надає можливість навчання роботизованих агентів на тестових середовищах в умовах, що наближені до реальних, адже враховують похибки камери. Цей метод дозволяє налаштовувати конфігурацію камери у навчальній системі для адаптації моделі до реальної конфігурації роботизованої системи, що забезпечує зменшення похибок параметрів камери під час калібрування та суттєве підвищення успішності стійкого захвату кінцівкою. Практичне значення одержаних результатів полягає у експериментально підтвердженій ефективності представлених методів на відомих тестових середовищах OpenAI Gym для перевірки якості нейроеволюційних алгоритмів як для двовимірних моделей середовищ, так і для тривимірних, де інформацію про стан середовища роботизований агент отримує з камери, що наближено до роботи системи в умовах реального світу. Отримано патент на засоби калібрування камери для підвищення якості вхідних даних з камери, що використовується для автоматизованого управління роботизованою кінцівкою. Реалізовано метод пошуку новизни під час автоматизованого навчання моделі системи для двовимірного середовища та метод на основі гіперкуба для тривимірного середовища при виконанні маніпуляційних задач роботизованою кінцівкою. Встановлено, що використання представлених методів у нейроеволюційному процесі для вирішення задачі позиціонування дозволяє підвищити ефективність процесу навчання мережі та отримати оптимальну топологію управляючої мережі. Основні результати дисертаційної роботи опубліковано у 9 наукових працях, зокрема, у 5 наукових статтях, з яких 4 статті опубліковано у фахових виданнях, включених до переліку наукових фахових видань України з присвоєнням категорії «Б», та 1 статтю у інших виданнях. Крім того, 3 статті у матеріалах науково-технічних конференцій. Також опубліковано 1 патент.
  • ДокументВідкритий доступ
    Мова програмування та програмні засоби опису агентних моделей розповсюдження інфекційних захворювань
    (КПІ ім. Ігоря Сікорського, 2023) Сарнацький, Владислав Віталійович; Баклан, Ігор Всеволодович
    Сарнацький В.В. Мова програмування та програмні засоби опису агентних моделей розповсюдження інфекційних захворювань. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 121 – Інженерія програмного забезпечення та 12 – Інформаційні технології. – Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського», Київ, 2023. Дисертаційна робота присвячена розробці інструментального забезпечення для ефективного моделювання процесів розповсюдження інфекційних захворювань. Висвітлено основні напрями та тенденції розвитку сфери епідеміологічного моделювання у цілому та зокрема процесу розробки агентних епідеміологічних моделей. Були виявлені переваги та недоліки запропонованих дослідницькою спільнотою рішень та, зокрема, обсяг, гнучкість та швидкодія програмних засобів моделювання. Серед програмних засобів моделювання не було помічено представників, що поєднують у собі доступний інтерфейс з високою швидкодією та гнучкістю опису моделей. Був зроблений висновок, що розробка предметно-орієнтованої мови програмування для опису агентних моделей та графічного середовища розробки та аналізу нададуть доступний інтерфейс опису моделі у поєднанні зі значною гнучкістю та швидкодією. Виконана побудова загального математичного апарату епідеміологічної моделі агентного типу. У рамках математичної моделі була сформульована основна складність агентного епідеміологічного моделювання, а саме урахування контактів під час обчислення розподілу майбутнього стану захворювання. Запропоновано три алгоритми обчислення цього розподілу, проаналізована їх алгоритмічна складність. Також, для одного з них – алгоритму з групуванням було виконане дослідження оптимальної його імплементації. З огляду на розроблену математичну модель було дано визначення формальної граматики предметно-орієнтованої мови опису агентної епідеміологічної моделі CTrace. Мова надає вбудований високорівневий інтерфейс для задання основних сутностей заданої загальної епідеміологічної моделі, а також відношень між ними. Мова підтримує задання ймовірнісних розподілів різного типу та основні операції між ними що значно спрощує задання соціодемографічної параметризації моделей. Виконана побудова транслятора розробленої формальної мови опису агентної епідеміологічної моделі. Розроблений транслятор є компілятором із конфігурованою проміжною мовою. Такою мовою може бути Python, який своєю чергою транслюється у мову машинних інструкцій під час процесу JIT-компіляції, або будь-яка мова загального призначення, що має інтерфейс до побудови Pythonмодулів. Такою мовою була обрана мова Rust. Основним аспектом алгоритму трансляції є мінімізація кількості виділень пам’яті у процесі виконання результівної програми. Для цього, компілятор обраховує загальний обсяг пам’яті, необхідний для роботи моделі, і використовує буфер відповідного розміру для організації усіх обчислень. Розроблене середовище розробки та аналізу агентних епідеміологічних моделей з використанням мови CTrace – CTraceEnv. Розроблене середовище надає базовий функціонал необхідний для підтримки процесу опису моделей мовою CTrace, що включає підсвітку синтаксису вихідного коду, вбудований транслятор тощо. Серед функціоналу аналізу представлені елементи керування роботою моделі, значень її глобальних параметрів, інтерфейс перегляду динаміки розповсюдження досліджуваного інфекційного захворювання, а також функціонал експорту результатів для подальшого аналізу сторонніми спеціалізованими інструментами. Проведений аналіз розробленої мови опису агентних епідеміологічних моделей з боку доцільності її використання, обсягу сценаріїв, що можуть бути змодельовані, ефективності розробки та використання Виконана практична апробація розробленого інструментарію для ефективного моделювання розповсюдження інфекційних захворювань. У її рамках, було дано визначення агентної епідеміологічної моделі розповсюдження коронавірусу SARS-CoV-2 серед населення Польщі у період з початку вересня 2020 року до кінця листопада 2020 року, що була відкалібрована з використанням публічно доступних епідеміологічних даних. Результівна модель описує динаміку зміни кількості інфікованих людей з коефіцієнтом детермінації рівним 0.9319, що свідчить про здатність розробленого підходу описувати процеси розповсюдження інфекційних захворювань. Проведений аналіз впливу соціодемографічної гетерогенності середовища моделювання на якість карантинних стратегій побудованих на його основі. Відповідний експеримент полягав у реалізації алгоритму пошуку карантинних стратегій для заданої агентної епідеміологічної моделі країни Європейського Союзу. Соціодемографічна параметризація моделі побудована з використанням статистичного моделювання на основі відкритих історичних даних, з відкритої бази статистичних даних Eurostat. Знайдені алгоритмом стратегії були порівняні із тривіальними, що показало більшу їх ефективність та використані у процесі перехресного порівняння. Для цього, стратегія, отримана з моделі країни тестування була порівняна з іншими. В обох випадках критерієм порівняння виступала сумарна винагорода за дії агента, що використовує відповідну стратегію у середовищі моделювання, сформульованим як Марківський процес вирішення. Аналіз показав, що для покращення їх якості соціодемографічні показники мають бути ураховані, що, своєю чергою, показує необхідність наявності їх задання у будь-якому інструменті епідеміологічного моделювання. Це свідчить про доцільність тої уваги, що була приділена процесу їх задання при розробці мови CTrace. Окремо був проведений якісний аналіз спектра сценаріїв, що можуть бути змодельовані з використанням мови CTrace. Показано моделювання таких аспектів агентного епідеміологічного моделювання як: динамічні параметри моделі та її сутностей, географія середовища, погодні умови, векторні захворювання. Аналіз ефективності розробки епідеміологічних моделей мовою CTrace показав значне скорочення обсягу вихідного коду програми у порівнянні з моделями імплементованими мовами програмування загального призначення. В якості цих моделей, був використаний лістинг програмного коду проміжною мовою, що генерується транслятором. Скорочення обсягу програмного коду становило від 14 до 34 разів для мови Python та від 16 до 45 разів для мови Rust. Це скорочення може свідчити про зменшення кількості людино-годин необхідних для їх розробки, а також збільшену швидкість ітерування. Окрім цього, зменшення обсягу вихідного коду призводить до зменшення кількості помилок, що, своєю чергою, зменшує час опису моделей. Дано визначення метрики функціональності інструменту епідеміологічного моделювання, що дозволяє оцінити обсяг сценаріїв та функцій доступних користувачу. Дано визначення метрики ефективності моделі, що дозволяє виконувати порівняння різних моделей та інструментів моделювання з точки зору їх обчислювальної ефективності. Ця метрика є інваріантною до кількості агентів, тривалості симуляції, її гранульованості та кількості одночасно залучених до обчислення моделі ядер центрального процесору. Аналіз швидкодії результівних моделей, заданих мовою CTrace, ставив дві мети: обґрунтувати доцільність використання мови Python як проміжної мови трансляції, а також порівняти їх швидкодію з наявними моделями. Показано, що використання мови Python з бібліотекою для JIT-компіляції Numba дозволяє отримати швидкодію моделей, порівняну з отриманою у разі використання мови Rust, ефективність якої порівняна з C/C++. При цьому, гнучкість мови Python дозволяє відносно просто вносити корективи у процес трансляції. Експерименти з використанням різних тестових середовищ показали, що існуючі епідеміологічні моделі не виграють у швидкодії у розроблених мовою CTrace еквівалентів. З результатів порівняння розробленого середовища CTraceEnv з аналогами за визначеними метриками ефективності та функціональності можна зробити висновок що обсяг функцій агентного епідеміологічного моделювання наданий CTraceEnv є значно більшим за аналоги й приблизно відповідає середовищу NetLogo, надаючи при цьому ефективність результівних моделей, що не програє аналогам.
  • ДокументВідкритий доступ
    Методи та програмні засоби багатовимірної поліноміальної регресії за надлишковим описом на основі побудови одновимірної регресії з використанням ортогональних поліномів Форсайта
    (КПІ ім. Ігоря Сікорського, 2023) Головченко, Максим Миколайович; Павлов, Олександр Анатолійович
    Головченко М.М. Методи та програмні засоби багатовимірної поліноміальної регресії за надлишковим описом на основі побудови одновимірної регресії з використанням ортогональних поліномів Форсайта. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 121 – Інженерія програмного забезпечення з галузі знань 12 – Інформаційні технології. – Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського», Київ, 2023. Дисертаційна робота присвячена розробці універсального синтетичного методу оцінок коефіцієнтів багатовимірної поліноміальної регресії, заданої надлишковим описом та створенням оригінальних програмних засобів, що ефективно реалізують цей метод. У процесі розробки та дослідження ефективності синтетичного методу були отримані такі результати. Вперше розроблено синтетичний метод побудови багатовимірної поліноміальної регресії, заданої надлишковим описом, що відрізняється від існуючих тим, що органічно поєднує риси класичного методу (теоретично обґрунтовані випадки, в яких оцінка коефіцієнтів при нелінійних членах знаходиться з заданою точністю) з ефективністю евристичних методів (знаходження структури регресії з використанням перевірочної послідовності в модифікованому методі групового урахування аргументів, що входить в склад синтетичного методу), а також включає в себе метод побудови одновимірної поліноміальної регресії на основі довільного повторного активного експерименту з використанням лише одного набору нормованих ортогональних поліномів Форсайта, декомпозиційний метод оцінки коефіцієнтів при нелінійних членах багатовимірної поліноміальної регресії з наперед заданою точністю, що багатовимірну задачу зводить до послідовної побудови відповідних одновимірних поліноміальних регресій. Вперше обґрунтовано можливість знаходження нормованих ортогональних поліномів Форсайта з наперед заданою точністю, яка досягається за рахунок представлення даних у вигляді раціональних дробів та застосування до них символьних обчислень, що дозволяє отримати оцінки коефіцієнтів при нелінійних членах багатовимірної поліноміальної регресії, значення яких відповідають теоретично виведеним умовам. Вперше приведено теоретичне обґрунтування зменшення обчислювальної складності програмного забезпечення реалізації методу найменших квадратів на основі повторних експериментів, що полягає в заміні операцій з матрицями повного активного експерименту операціями з матрицями основного експерименту суттєво меншої розмірності. Вперше запропоновано архітектуру кросплатформної бібліотеки для реалізації синтетичного методу та його складових, яка дозволяє використовувати її компоненти, як окремо, так і в цілому для розв'язання прикладних задач побудови регресійних моделей. Проведено дослідження ефективності алгоритмів, що реалізують операції з матрицями в методі найменших квадратів, зокрема обґрунтовано можливість використання паралельних обчислень. Розглядаються матричні операції, які входять у формулу для знаходження оцінок коефіцієнтів багатовимірної поліноміальної регресії методом найменших квадратів як складової модифікованого методу групового урахування аргументів та можуть виконуватись ефективніше при застосуванні паралельних обчислень. Було виконано дослідження ефективності алгоритмів множення матриць та обернення матриць, як складових задачі знаходження оцінок коефіцієнтів багатовимірної поліноміальної регресії модифікованим методом групового урахування аргументів. Це дослідження ефективності алгоритмів виконувалось шляхом реалізації алгоритмів на базі 8-ми ядерного мікропроцесора Apple M1 та фіксації часу роботи різних алгоритмів для фіксованої кількості потоків та квадратних матриць заданої розмірності. Приведено обґрунтування можливості розпаралелювання обчислень в модифікованому методі групового урахування аргументів для знаходження оцінок коефіцієнтів часткових описів та залишкових сум квадратів. Реалізовано кросплатформну бібліотеку та її програмний інтерфейс для побудови регресійних моделей. Так, для користувачів, які володіють базовими навичками у області програмування і статистичного аналізу та бажають отримати розв’язок задачі побудови багатовимірної поліноміальної регресії достатньо у автоматизованому режимі підключити кросплатформну бібліотеку у власний застосунок та передати у її функції бібліотеки вхідні дані. В цьому випадку функції кросплатформної бібліотеки аналізують надлишковий опис і визначають, що він відноситься до класу, у якому всі лінійні системи мають лише одну змінну, якщо це не так, то задача розв’язується повністю модифікованим методом групового урахування аргументів. У протилежному випадку, програма аналізує можливості декомпозиційного методу та видає вимоги для проведення відповідної кількості повторних активних експериментів для побудови одновимірних поліноміальних регресій та множину коефіцієнтів, які будуть оцінені. Далі формується багатовимірна поліноміальна регресія задана надлишковим описом, яка буде розв’язана модифікованим методом групового урахування аргументів. Для користувачів, які володіють розширеними навичками у області програмування і статистичного аналізу та бажають отримати розв’язок задачі побудови багатовимірної поліноміальної регресії, повинні ознайомитись з детальною інструкцією по роботі з кросплатформною бібліотекою, у якій описані теоретичні положення та практичні рекомендації з використання синтетичного методу. Далі користувачі за допомогою функцій кросплатформної бібліотеки у частині декомпозиційного методу можуть запрограмувати індивідуальний алгоритм розв’язку задачі на основі теоретичних положень синтетичного методу. У частині модифікованого методу групового урахування аргументів все залишається без змін. За результатами виконання синтетичного методу користувачу буде виданий кінцевий результат, який містить структуру багатовимірної поліноміальної регресії, знайдені декомпозиційним методом оцінки коефіцієнтів багатовимірної поліноміальної регресії та їх дисперсії та оцінки коефіцієнтів багатовимірної поліноміальної регресії з оцінками їх дисперсій, знайдені за допомогою модифікованого методу групового урахування аргументів, з оцінкою результатів – має високу ступінь достовірності; задовільну ступінь достовірності; результат недостовірний. При розробці кросплатформної бібліотеки, що реалізує синтетичний метод, використовувались такі допоміжні засоби. В якості мови реалізації кросплатформної бібліотеки була обрана Python, оскільки дана мова програмування краще за інші підходить для реалізації data science та статистичних методів обробки даних. Крім того для мови Python існує великий набір високорівневих фреймворків різного призначення та програмних бібліотек, які можна використовувати у якості допоміжних засобів при розробці. Середовищем розробки кросплатформної бібліотеки було обрано IntelliJ IDEA через наявність безкоштовної експрес-версії та зручність встановлення допоміжних програмних пакетів та бібліотек. У якості архітектури кросплатформної бібліотеки було використано монолітну архітектуру, оскільки решта архітектур програмного забезпечення – багаторівнева, клієнт-серверна, мікросервісна, сервісно-орієнтована – не рекомендується для використання при розробці такого роду програмного забезпечення. Внутрішня логіка бібліотеки побудована з використанням компонентно-орієнтованого підходу, так як даний підхід добре себе зарекомендував при розробці програмного забезпечення цільового призначення, що використовується при розробці цільового прикладного програмного забезпечення. В якості пакету для паралельної реалізації деяких підалгоритмів було використано multiprocessing, а для реалізації символьних обчислень було використано бібліотеку SymPy. Для розгортання кросплатформної бібліотеки було використано систему управління пакетами pip. Це універсальна, зручна і найбільш популярна система управління пакетами, написаними для мови програмування Python. В результаті розгортання користувачі зможуть завантажувати і встановлювати бібліотеку для своїх потреб командою pip install regression_lib_mpr у своєму середовищі розробки. Дисертаційна робота складається зі вступу, чотирьох розділів, загальних висновків, списку використаних джерел із 84 найменувань на дев’яти сторінках та чотирьох додатків. Загальний обсяг дисертації становить 185 сторінок, з яких 128 сторінок основного тексту, містить 23 рисунки та 24 таблиці.
  • ДокументВідкритий доступ
    Методи візуального програмування Петрі-об'єктних моделей
    (КПІ ім. Ігоря Сікорського, 2022) Дифучин, Антон Юрійович; Жаріков, Едуард В‘ячеславович
    Дисертаційна робота присвячена розробці методів та засобів візуального програмування моделей дискретно-подійних систем, формалізованих у вигляді Петрі-об‘єктної моделі. Візуальне програмування є способом розробки програм, що використовує візуальні об‘єкти для опису завдання на виконання обчислень. Для того, щоб візуальне представлення стало візуальним програмуванням необхідно гарантувати однозначне перетворення візуального представлення у обчислення. Таку однозначність перетворення гарантує розробка формальної мови програмування. На сьогоднішній день положення теорії формальних мов сформульовані в припущенні, що мова є текстовою, і адаптації цих положень до мови програмування, в якій символами є елементи візуального представлення, є невирішеним завданням. Особливе місце візуальні засоби представлення займають у програмних засобах з імітаційного моделювання, оскільки слугують не тільки для конструювання моделі, але й для її відлагодження та представлення кінцевого результату імітації. Існуючі програмні засоби з імітаційного моделювання широко застосовують графічні редактори для конструювання моделі з блоків або з більш низькорівневих елементів, наприклад, елементів мережі Петрі. Процес розробки моделі у графічному редакторі є трудомістким і довготривалим, а у випадку великої кількості елементів часто є неможливим, оскільки потребує великого обсягу рутинної роботи з елементами та налаштуванням їх параметрів. Імітаційні моделі є одним з потужних інструментів обробки даних з метою пошуку оптимальних умов або короткострокового прогнозування. У поєднанні з даними, що постачаються у реальному часі, вони можуть стати потужним компонентом сучасних систем прийняття рішень та управління. Тому розробка нових методів та програмних засобів, що спрямовані на підвищення ефективності процесу програмної реалізації моделі за рахунок автоматизації кодування, є актуальним науковим завданням. Метою наукового дослідження є підвищення ефективності програмних засобів представлення складних моделей систем для цілей імітаційного моделювання за рахунок зменшення складності конструювання моделі та збільшення швидкодії алгоритмів імітації, зручності сприйняття моделі, зменшення кількості помилок при створенні зв‘язків між елементами моделі та зменшення часу на модифікацію моделі. У першому розділі наведено огляд існуючих програмних засобів моделювання систем стохастичними мережа Петрі та обґрунтовано розробку мови візуального програмування. Виявлено, що графічні редактори не вирішують низку проблем: неможливість коригування параметрів моделі без коригування її візуального представлення, неможливість тиражування однотипних елементів у великій кількості (оскільки усі вони будуть займати візуальний простір), неможливість тиражування зв‘яків при повторному використанні фрагментів мережі Петрі, неможливість налаштування параметрів елементів без коригування кожного окремого параметра у спеціально відведеному для цього вікні. У другому розділі наведені відомості з теорії стохастичних мереж Петрі та основні теоретичні положення Петрі-об‘єктного моделювання. Формальний опис Петрі-об‘єктної моделі розвинутий за рахунок введення понять конектора Петрі-об‘єктів, групи Петрі-об‘єктів, колекції Петрі-об‘єктів. Введені поняття відкривають можливість тиражування зв‘язків при конструюванні Петріоб‘єктної моделі. Проте відсутність візуального представлення моделі робить процес розробки моделі складним через рутинні та схильні до помилок операції кодування зв‘язків між елементами. У третьому розділі представлена формальна граматика мови Петріоб‘єктного моделювання, яка розроблена. Алфавіт мови складається з графічних елементів візуального представлення, а дозволені мовою набори графічних елементів утворюють лексеми мови. Синтаксис мови визначений правилами виведення граматики, в основі яких правила утворення триплетів елементів. Для розробленої контекстно-вільної граматики встановлено, що вона є однозначною і приведеною. Наведений приклад розробки моделі інформаційної системи розробленою мовою. У четвертому розділі представлена розробка транслятора мови візуального програмування Петрі-об‘єктних моделей. На клієнтській частині веб застосування реалізована частина транслятора, що відповідає за лексичний та синтаксичний аналіз мовного виразу. На серверній частині веб застосування реалізована частина транслятора, що виконує семантичний аналіз мовного виразу. Для передачі даних між клієнтом та сервером використовується JSON формат. У розділі представлена інтерпретація символів алфавіту мови візуального програмування Петрі-об‘єктних моделей мовою TypeScript. Запуск на обчислення відбувається після перетворення отриманих у форматі JSON даних в об‘єкт PetriObjModel бібліотеки Петрі-об‘єктного моделювання PetriObjLIb. Обчислення Петрі-об‘єктної моделі – це відтворення подій в часі алгоритмом імітації. П’ятий розділ містить результати експериментального дослідження процесу розробки моделей, точності моделювання та швидкодії обчислення моделі. Результати, отримані у дисертаційному дослідженні, містять наукову новизну. Вперше розроблено візуальну мову програмування Петрі-об‘єктних моделей, яка дозволяє спростити процес побудови моделей, підвищити наочність сприйняття моделей та час виконання імітаційного моделювання шляхом організації дворівневого способу побудови моделей. На відміну від існуючих рішень в області імітаційного моделювання, візуальна мова програмування Петрі-об‘єктних моделей надає універсальний та гнучкий інструмент для побудови моделей дискретно-подійних систем, а процес виконання імітаційного моделювання не залежить від обчислювальних ресурсів користувача. Удосконалено Петрі-об‘єктну модель за рахунок введення поняття групи Петрі-об‘єктів, колекції Петрі-об‘єктів та групи колекцій Петрі-об‘єктів, що, на відміну від існуючих засобів представлення імітаційної моделі, надають можливість тиражувати Петрі-об‘єкти з заданими наборами параметрів, тиражувати колекції взаємопов‘язаних Петрі-об‘єктів та тиражувати зв‘язки між Петрі-об‘єктом та групою Петрі-об‘єктів, між Петрі-об‘єктом та групою колекцій Петрі-об‘єктів. За рахунок тиражування однотипних фрагментів моделі та тиражування зв‘язків створюються умови для швидкого конструювання моделей з великою кількістю елементів та значно скорочується обсяг їх візуального представлення. Вперше запропоновано клієнт-серверну архітектуру серед програмного забезпечення з імітаційного моделювання на основі Петрі-об‘єктного підходу, використання якої дозволяє задіяти ресурси віддаленого серверу для проведення імітаційного моделювання для забезпечення стабільного часу виконання, зменшення витрат на інфраструктуру обчислювальних ресурсів серед користувачів та організації спільного доступу до розробки моделей. Результати дисертаційної роботи опубліковано у 7 наукових публікаціях, серед яких 1 стаття у періодичному науковому виданні, проіндексованому у Web of Science Core Collection та Scopus базах даних, 2 статті у фаховому науковому журналі категорії «Б», 1 стаття у фаховому науковому журналі категорії «В», 1 стаття у науковому журналі, проіндексованому GoogleScholar, 2 публікації у матеріалах міжнародних наукових конференцій, проіндексованих у Scopus.