Дисертації (ІПІ)

Постійне посилання зібрання

https://ela.kpi.ua/handle/123456789/43213

У зібранні розміщено дисертації, які захищені працівниками кафедри.

Переглянути

Зараз показуємо 1 - 10 з 10

Відкритий доступ
Методи та програмні засоби для вирішення задачі класифікації на основі тривимірних нейронних мереж
(КПІ ім. Ігоря Сікорського, 2025) Паладієв, Олександр Олегович; Лісовиченко, Олег Іванович
Паладієв О.О. Методи та програмні засоби для вирішення задачі класифікації на основі тривимірних нейронних мереж. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 121 – Інженерія програмного забезпечення з галузі знань 12 – Інформаційні технології. – Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського», Київ,, 2025. Дисертаційна робота присвячена розробці та дослідженню спеціалізованих програмних засобів для ефективної класифікації тривимірних зображень з можливістю їх інтеграції в різноманітні автоматизовані процеси. Основною метою дослідження є вдосконалення методів обробки та аналізу тривимірних даних шляхом застосування передових підходів до проектування архітектур нейронних мереж і розробки адаптивних алгоритмів оптимізації. У ході виконання роботи досягнуто наступних результатів: Вперше запропоновано використання опонентної кольорової системи як методу попередньої обробки даних. Запропонований метод підвищує інформативність ознак і покращує їхню інтерпретацію нейронними мережами, що суттєво зменшує втрати при класифікації. Додатково, досліджено особливості роботи опонентної системи в умовах різного рівня зашумленості вхідних даних, що дозволило розробити стратегії її адаптації до специфічних наборів зображень. Вперше розроблено топологію нейронних зв’язків яка реалізує локальнообмежені структури зв’язків з протилежними нейронами та їх безпосередніми сусідами в тривимірному просторі. Запропонована топологія поєднує розширювальні та звужувальні шари, що сприяє ефективному вилученню ознак. Особлива увага приділялася оптимізації параметрів цих шарів для забезпечення їхньої гнучкості й адаптивності під різні типи даних, а також визначенню оптимальної кількості нейронів і типів функцій активації для покращення навчання мережі. Вперше розроблено методи зміни кількості нейронних зв’язків. Ці підходи забезпечують підвищення швидкодії програмних засобів класифікації, за рахунок видалення слабких зв’язків та підвищення точності класифікації за рахунок генерації нових зв’язків для нейронів з вагами, наближеними до меж функції активації. Розроблено та протестовано кілька методів адаптації, включаючи методи поступового усічення ваг і додавання нових зв'язків для підвищення стійкості моделі до варіативності вхідних даних. Розроблено програмні засоби для забезпечення доступу до функціоналу класифікації тривимірних зображень, який дозволяє інтегрувати можливості класифікації в різні автоматизовані процеси. Реалізоване рішення підтримує масштабованість обробки великих обсягів даних, включаючи функції попередньої обробки, аналізу результатів і моніторингу продуктивності. Здійснено детальне тестування продуктивності розроблених програмних засобів на основі двох тривимірних наборів даних. Результати експериментів підтвердили високу точність і продуктивність розробленого підходу, що забезпечує його конкурентоспроможність у вирішенні задач автоматизованої класифікації складних тривимірних структур. Таким чином, створений метод класифікації та програмні засоби є ефективним рішенням для класифікації тривимірних зображень, поєднуючи новітні архітектури нейронних мереж і алгоритми оптимізації для досягнення високих показників точності та продуктивності. Запропонований підхід демонструє високу гнучкість і адаптивність, що дозволяє його застосування в широкому спектрі прикладних задач, включаючи медичну діагностику, промислову автоматизацію та аналіз наукових даних. Дисертаційна робота складається зі вступу, чотирьох розділів, висновків, списку використаних джерел та додатків. Загальний обсяг роботи становить 212 сторінок, з яких 168 сторінок основного тексту. Робота містить 50 рисунків, 3 таблиці та 80 літературних джерел.
Відкритий доступ
Алгоритмічне та програмне забезпечення регіональної системи моніторингу стану потенційно небезпечних об’єктів
(КПІ ім. Ігоря Сікорського, 2025) Соколовський, Владислав Володимирович; Жаріков, Едуард В’ячеславович
Соколовський В.В. Алгоритмічне та програмне забезпечення регіональної системи моніторингу стану потенційно небезпечних об’єктів. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії в галузі знань – 12 Інформаційні технології за спеціальністю – 121 Інженерія програмного забезпечення –- Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2025. На території України функціонує значна кількість споруд, класифікованих як потенційно небезпечні об’єкти, аварії на яких можуть призвести до виникнення техногенних надзвичайних ситуацій. В умовах збройної агресії РФ забезпечення безпеки життя та здоров’я населення, а також екологічної безпеки територій, де розташовані потенційно небезпечні об’єкти, набуває особливої актуальності. При оцінюванні ризиків необхідно враховувати не лише безпосередні наслідки аварій на об’єктах, але й потенційний вплив на населення, інфраструктуру прилеглих територій та інші промислові об’єкти. За таких обставин існує нагальна потреба у створенні комплексних систем моніторингу стану потенційно небезпечних об’єктів на всіх рівнях: об’єктовому, місцевому, регіональному та державному. Хоча наразі функціонує значна кількість систем моніторингу стану потенційно небезпечних об’єктів об’єктового та місцевого рівнів, підвищення надійності експлуатації та рівня безпеки потенційно небезпечних об’єктів у спосіб удосконалення процесів збору, обробки та передачі даних в інформаційній системі моніторингу стану потенційно небезпечних об’єктів на основі розроблення спеціалізованого прикладного програмного забезпечення з використанням технології інтернету речей та розроблення програмного забезпечення та методів обробки інформації для регіональних систем моніторингу стану потенційно небезпечних об’єктів залишається актуальною науково-практичною задачею. Сучасна система моніторингу стану потенційно небезпечних об’єктів являє собою програмно-технічний комплекс, що базується на принципах інженерії програмного забезпечення та використовує сучасні методи розробки програмного забезпечення. Впровадження такої системи дозволяє підвищити ефективність експлуатації промислових об’єктів та поліпшити організацію захисту населення та робочого персоналу у спосіб раннього виявлення можливості виникнення надзвичайної ситуації. На регіональному та державному рівнях такі системи не створені. Аналіз наявних систем моніторингу стану потенційно небезпечних об’єктів демонструє, що такі програмні комплекси здійснюють збір та обробку даних щодо ключових параметрів об’єкта та виконують їх параметричний контроль. Програмне забезпечення визначає, чи перевищують значення одного або декількох контрольованих параметрів об’єкта попередньо встановлені критичні рівні, або наближаються до них. При виявленні перевищення критичних значень параметрів, система автоматично генерує сповіщення для чергового персоналу про можливість виникнення надзвичайної ситуації та надає покрокові інструкції щодо необхідних дій для запобігання розвитку аварії та недопущення переходу об’єкта у стан надзвичайної ситуації. Такий підхід суттєво обмежує часові рамки для впровадження протиаварійних заходів. До того ж сучасні промислові об’єкти характеризуються складною просторово розподіленою структурою, що охоплює значні території. Це створює підвищену вразливість компонентів програмно-апаратного комплексу моніторингу стану потенційно небезпечних об’єктів до електромагнітних завад. Зазначені виклики та сучасні тенденції розвитку регіональних розподілених систем моніторингу стану потенційно небезпечних об’єктів формують актуальне науково-технічне завдання щодо вдосконалення теоретичних засад розробки програмного забезпечення як інформаційного об’єкта та створення ефективних алгоритмів для регіональних систем моніторингу стану потенційно небезпечних об’єктів, яке вирішується в межах цього дисертаційного дослідження. Метою дисертаційного дослідження є підвищення надійності експлуатації та рівня безпеки потенційно небезпечних об’єктів у спосіб удосконалення процесів збору, обробки та передачі даних в інформаційній системі моніторингу стану потенційно небезпечних об’єктів на основі розроблення спеціалізованого прикладного програмного забезпечення з використанням технології інтернету речей, методів завадостійкого кодування даних, моделювання процесів об’єкта моніторингу, а також методів прогнозування зміни його стану. Для досягнення поставленої мети розроблено та теоретично обґрунтовано наукові положення, методологічні засади та практичні рекомендації щодо вибору методів, алгоритмів, а також вирішено проблема побудови архітектури програмного забезпечення на основі системного підходу до обробки даних моніторингу, прогнозування стану об’єктів та оптимізації процесів. Досягнення поставленої мети забезпечено у спосіб розв’язання комплексу теоретичних, методологічних та практичних задач інженерії програмного забезпечення, які розглянуто в наступних розділах дисертаційного дослідження. У першому розділі виконаний аналітичний аналіз сучасного стану впровадження регіональних інформаційних систем моніторингу стану потенційно небезпечних об’єктів, аналіз законодавчої бази та наукової літератури, а також виконано дослідження сучасних теоретичних та методологічних основ проєктування систем моніторингу стану потенційно небезпечних об’єктів, проаналізовані архітектурні та технологічні аспекти проєктування систем моніторингу. На підставі проведеного аналізу сформульовано науково-технічну задачу та визначено комплекс завдань дослідження, спрямованих на підвищення ефективності процесу проєктування регіональних систем моніторингу стану потенційно небезпечних об’єктів. У другому розділі виконаний аналіз наявних систем моніторингу, а на основі аналізу запропоновано розв’язання проблеми побудови архітектури регіональної системи моніторингу стану потенційно небезпечних об’єктів на основі мережі Інтернету речей з топологією «зірка» з інтегрованою системою управління та предиктивними аналітичними підсистемами на об’єктовому, місцевому та регіональних рівнях. На основі аналізу наявних методів передачі даних в мережах Інтернету речей запропоновано та розроблено метод застосування завадостійкого коригувального коду з можливістю виявлення та виправлення багатобітових помилок передачі даних. Виконане тестування інформаційного об’єкта – програмної моделі каналу передачі даних підтвердило корегувальні можливості запропонованого методу виявлення та виправлення помилок. Вирішена проблема побудови архітектури інформаційної системи, розроблене алгоритмічне та програмне забезпечення для програмованих давачів, які запропоновано використовувати як вузли збору інформації від джерел інформації у вигляді первинних перетворювачів на об’єктовому рівні. У третьому розділі на основі аналізу публікацій доведено, що має сенс у складі регіональних інформаційних систем моніторингу стану потенційно небезпечних об’єктів мати підсистеми предиктивної аналітики як на об’єктовому рівні, так і на місцевому та регіональному рівнях. Запропоновано, що на об’єктовому рівні підсистема предиктивної аналітики повинна виконувати функції короткочасного прогнозування з метою раннього виявлення можливості виникнення надзвичайної ситуації на потенційно небезпечних об’єктах, що забезпечить збільшення часу (на три-чотири відліки) на реагування та впровадження протиаварійних заходів оперативним персоналом. Реалізовано алгоритмічне та програмне забезпечення для здійснення короткочасних прогнозів на базі використання методу найменших квадратів. Розглянуто використання на місцевому та регіональному рівнях підсистем предиктивної аналітики. Обґрунтовано, що підсистема предиктивної аналітики на місцевому та регіональному рівнях повинна мати можливість виконувати функції моделювання стану найбільш потенційно небезпечних об’єктів, а тому розглянуто моделювання процесів фільтрації на прикладі земляних напірних гідроспоруд -– потенційно небезпечних об’єктів, аварії на яких призводять до масштабних наслідків. Моделювання запропоновано виконувати використовуючи запропонований модифікований метод сіток. Відзначено, що моделювання дозволяє оперативно отримати якісну картину можливого розвитку деструктивних процесів стану потенційно небезпечних об’єктів. У четвертому розділі проаналізовано можливі методи оцінки якості алгоритмічного та програмного забезпечення. Розроблена методика оцінки якості архітектури, алгоритмічного та програмного забезпечення на основі використання експертного оцінювання. На основі розробленої методики виконано експертне оцінювання якості архітектур, а також алгоритмічного та програмного забезпечення. Експертне оцінювання підтвердило якість прийнятих методів та алгоритмів при розробці типових рішень та рекомендацій, а саме: необхідність побудови регіональних систем моніторингу стану потенційно небезпечних об’єктів на основі мереж Інтернету речей, використання у якості вузла комп’ютерної мережі збору інформації від первинних перетворювачів програмованих давачів, використання для забезпечення завадостійкої передачі даних модифікованого методу виявлення та виправлення багатобітових помилок передачі даних на базі використання корегувальних кодів Хеммінга, а також необхідність використання на всіх рівнях системи моніторингу предиктивних аналітичних підсистем. Потрібно також відзначити, що розроблена регіональна система моніторингу стану потенційно небезпечних об’єктів має високі вагові коефіцієнти функціональної стійкості. У дисертаційному дослідженні отримано низку нових наукових результатів: Уперше розроблено архітектуру як ядро системи моніторингу стану потенційно небезпечних об’єктів, яка відрізняється від наявних використанням технологій Інтернету речей, забезпеченням завадостійкої передачі даних, можливістю прогнозування змін параметрів джерел небезпеки, що характеризують стан об’єкта, а також можливістю моделювання процесів, які призводять до зміни стану об’єкту моніторингу, що дозволяє підвищити надійність експлуатації та рівня безпеки потенційно небезпечних об’єктів. Уперше розроблено архітектуру, алгоритмічне та програмне забезпечення для давачів вихідної інформації у складі завадостійкої регіональної системи моніторингу стану потенційно небезпечних об’єктів на базі технологій Інтернету речей, особливість яких полягає в тому, що давачі вихідної інформації можуть бути використані у системах моніторингу, у яких використовується побайтова передача даних у вигляді інформаційних блоків, що складаються з інформаційних та контрольних бітів, які перед передачею перемішують згідно зі схемою кодування, що дозволяє зменшити вплив електромагнітних завад при передачі даних та забезпечити цілісність даних. Уперше розроблено метод виявлення та виправлення багатобітових помилок при передачі інформації, а також алгоритмічне та програмне забезпечення на базі використання кодів Хеммінга, модифікованої схеми кодування та процедур кодування і декодування, який відрізняється процедурою перемішування бітів інформаційного блоку перед передачею в канал зв’язку, що дозволяє підвищити завадостійкість систем моніторингу стану потенційно небезпечних об’єктів. Удосконалено теоретичні засади розроблення спеціалізованого програмного забезпечення аналітичних предиктивних підсистем регіональних систем моніторингу стану потенційно небезпечних об’єктів, які відрізняються від наявних тим, що розроблені шаблони для реалізації функції прогнозування змін значення параметрів джерел небезпеки в межах потенційно небезпечних об’єктів на об’єктовому рівні та функції моделювання стану потенційно небезпечних об’єктів на місцевому та регіональному рівнях, що дозволяє забезпечити раннє виявлення можливості виникнення надзвичайної ситуації та локалізацію можливих дефектів шляхом розвитку деструктивних процесів. Уперше розроблене алгоритмічне та програмне забезпечення ітераційного методу розрахунку фільтрації води крізь напірні земляні гідроспоруди, яке відрізняється використанням двомірних математичних моделей для виявлення можливості руйнування гідроспоруди, що дозволяє спростити процес програмування аналітичних предиктивних підсистем на місцевому та регіональному рівнях, а також завчасно приймати управлінські рішення по запобіганню виникненню аварій та переходу їх в стан надзвичайної ситуації. Основні наукові результати дисертаційного дослідження опубліковано у 7 наукових працях, з них: 4 статті в закордонних наукових виданнях проіндексовані в системі Scopus, а також 3 публікації в міжнародних і всеукраїнських конференціях.
Відкритий доступ
Методи та програмні засоби пришвидшення донавчання класифікатора для діагностики захворювань за зображеннями
(КПІ ім. Ігоря Сікорського, 2025) Смілянець, Федір Андрійович; Фіногенов, Олексій Дмитрович
Смілянець Ф.А. Методи та програмні засоби пришвидшення донавчання класифікатора для діагностики захворювань за зображеннями. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 121 – Інженерія програмного забезпечення з галузі знань 12 – Інформаційні технології. – Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського», Київ, 2025. Дисертаційна робота присвячена розробці методу класифікації медичних зображень, що спрямований на уникнення зміни топології згорткової нейронної мережі при додаванні нових класів, дозволяючи знизити накладні витрати часу на їх підтримку, та методу організації обчислень за допомогою потоків робіт, який будує граф потоку під час його виконання, чим дозволяє мінімізує час на впровадження змін у систему. Вчасна розробка та доступність засобів тестування на інфекційні захворювання є фундаментальним компонентом контролю над епідеміями та пандеміями на кожному етапі поширення хвороби. Доступна та швидка діагностика є ключовою для своєчасності виявлення спалахів інфекції, і, як наслідок, визначення переліку та ізоляції контактних осіб чи запровадження карантинних обмежень на певній території. Упереджувальна розробка інструментів виявлення захворювань, а також пошук підходів для прискорення їх отримання та впровадження є важливим для контролю над епідеміями в майбутньому. Одним зі способів виконання діагностики є аналіз медичних зображень за допомогою згорткових нейронних мереж. Однак, така класифікація призводить до необхідності у зміні топології моделі при виникненні потреби у додаванні нових класів. Це обмеження можна подолати через використання проміжних даних – вкладених представлень, що генеруватимуться нейронною мережею, та виконання класифікації за ними. Таким чином, нейронна мережа може бути дотренована для підтримки нового класу без зміни її топології. Алгоритми машинного навчання, щовиконують класифікацію можуть бути перетреновані для підтримки більшої кількості класів без втручання у код та за відносно короткий час. У той час як проєктування та тренування нейронних мереж широко висвітлюється в науковій літературі щодо виконання діагностики за допомогою аналізу зображень, питання практичної інтеграції моделей у програмне забезпечення практично не розглядається. Важливим аспектом засобу для діагностики є швидкість адаптації системи до появи нових захворювань. Відтак, є потреба у зменшенні зусиль, необхідних для додавання чи модифікацію методу діагностики, який виконується у засобі. Оскільки потоки робіт дозволяють інкапсулювати окремі етапи обробки даних та гнучко змінювати їх послідовність без втручання в код системи, їх використання значно зменшує час та складність впровадження змін. Потоки робіт є впорядкованими структурованими представленнями багатокрокових обчислювальних задач. Типовою моделлю для них є спрямовані ациклічні графи, вершини яких є певними операціями над даними, а ребра – перетікання виходів одних операцій у входи інших. Такий граф, що складається з вхідних даних, та їх послідовних перетворень за допомогою окремих вершин (також – кроків або інструментів), також часто називається пайплайном (англ. pipeline). Існуючі системи керування потоками робіт вимагають статичного визначення графу потоку робіт розробником системи. Існування даних статичних визначень уповільнює внесення змін. Одним зі способів вирішення даної проблеми є динамічне створення та обчислення потоків робіт виходячи з наданих даних та інструментів для їх обробки і перетворення, що дозволить розширяти існуючі засоби класифікації захворювань без втручання або мінімальним втручанням людини (фахівця). Метою дисертаційної роботи є зменшення часу адаптації програмного забезпечення аналізу медичних зображень для діагностики на основі алгоритмів машинного навчання. У першому розділі дисертаційної роботи проведено аналіз засобів та методів діагностики захворювань за допомогою класифікації знімків комп’ютерної томографії, та розглянуто існуючі системи керування потоками робіт. За результатами аналізу літературних джерел виділено найбільш результативні архітектури нейронних мереж та окреслено проблеми, що пов’язані з аналізом результатів. Розглянуто способи інтеграції нейронних мереж у програмне забезпечення та обґрунтовано використання потоків робіт. Проведено порівняльний аналіз сучасних систем керування потоками робіт. У другому розділі запропоновано можливість використання вкладених представлень для вирішення задачі класифікації зображень КТ. Запропоновано модифікацію існуючої нейронної мережі для побудови вкладених представлень та доведено можливість додавання нових класів без істотної втрати точності. Розроблено математичну модель для обрахунку часу на побудову класифікатора та наведено умови, що визначають його ефективність. У третьому розділі запропоновано метод для динамічної побудови графу потоку робіт під час його виконання, який дозволяє уникнути необхідності у його статичному визначенні вручну. Для запропонованого методу визначено основні сутності. Розроблено модель обрахунку часу виконання потоку робіт. Імітаційним моделюванням показано, що часом роботи алгоритму можна знехтувати відносно часу на корисні обчислення. Розроблено систему керування потоками робіт, що реалізує запропонований метод з використанням системи Kubernetes для розподілених кластерних обчислень та можливістю горизонтального масштабування. Проведено аналіз швидкодії системи та доведено її практичну застосовність. Розроблено математичну модель оцінки часу на побудову потоків робіт за запропонованим методом та наведено умови, що визначають межі ефективності його використання. У четвертому розділі виконано проєктування та реалізацію програмного забезпечення аналізу зображень КТ для діагностики захворювань. Представлено архітектуру програмного забезпечення. Розроблено низку обчислюючих засобів системи керування потоками робіт для виконання класифікації зображень комп’ютерної томографії, у тому числі за допомогою вкладених представлень. Реалізовано сервер та інтерфейс користувача системи. Наведено опис функціональності системи. Результати, отримані у дисертаційному дослідженні, містять наукову новизну – вперше запропоновано метод динамічного конструювання потоків робіт під час їх виконання, який відрізняється від наявних автоматичною побудовою графу виконання, що дозволяє виключити етап визначення статичного потоку робіт та зменшити час на впровадження змін у програмне забезпечення; – удосконалено метод класифікації зображень шляхом використання вкладених представлень, що дозволяє додавання нових класів без зміни топології нейронної мережі; – удосконалено математичну модель для оцінки часу адаптації програмного забезпечення класифікації зображень шляхом врахування складових часу модифікації класифікатора та побудови графу потоку робіт, що дає можливість порівнювати швидкості впровадження змін у програмне забезпечення та здійснювати обгрунтований вибір методів та архітектурних рішень. Розроблено хмарне програмне забезпечення для автоматизованої діагностики захворювань за допомогою аналізу знімків КТ. Запропоновані методи, застосовані у програмному засобі, дозволяють швидке дотренування та розширення для підтримки нових методів, розпізнавання нових захворювань тощо. Представлений метод динамічного конструювання потоків робіт та система на його основі можуть бути використані як заміна поточних систем організації обчислень у сфері біоінформатики, у тому числі для проведення геномних розрахунків. Розроблені в дисертації програмні засоби можуть використовуватись як окремо (СКПР, ПЗ аналізу знімків КТ для діагностики) так і в складі інших систем (наприклад, як складові систем підтримки прийняття рішень). Результати проведених досліджень було опубліковано у 9 наукових працях, з яких 4 у фахових наукових журналах категорії «Б», 1 у журналі, що індексується наукометричною базою даних Scopus, 4 у матеріалах міжнародних науково-практичних конференцій.
Відкритий доступ
Методи та програмне забезпечення розмітки відеоданих для задач комп’ютерного зору
(КПІ ім. Ігоря Сікорського, 2025) Зарічковий, Олександр Анатолійович; Стеценко, Інна Вячеславівна
Штучний інтелект є однією з найбільш поширених сфер розробок програмного забезпечення у сучасному світі інформаційних технологій. За останню декаду було досягнуто значного прогресу для задач комп'ютерного зору, зокрема, у детекції об’єктів, завдяки розвитку методів глибокого навчання та зростанню обчислювальних можливостей. Для успішної розробки та впровадження програмних засобів на основі ШІ необхідно збирати та розмічати великі об’єми даних, що вимагає значних людських ресурсів та часу. Неякісна розмітка даних може призвести до неточних та помилкових результатів методів ШІ, що в свою чергу стає причиною помилок у результатах обчислень програмного забезпечення. Наявні інструменти розмітки даних не завжди відповідають потребам розробників програмного забезпечення з використанням ШІ, особливо в контексті роботи з великими об'ємами відеоданих, що збільшує трудовитрати процесу створення якісних наборів даних. Наявність зазначених проблем визначає актуальне наукове завдання підвищення ефективності процесу розмітки відеоданих для задач комп’ютерного зору, яке вирішується у цій дисертаційній роботі. Метою дисертаційної роботи є підвищення швидкості розмітки відеоданих у контексті завдань детекції об'єктів за рахунок вдосконалення методів та програмного забезпечення, призначеного для розмітки відеоданих. Для досягнення мети в роботі досліджено методи навчання нейронних мереж, що підвищують точність детекції об’єктів без змін моделей чи збільшення їх параметрів, та підходи до зменшення обсягу кадрів, які обробляються в задачах комп’ютерного зору. Проведено аналіз візуально-мовних моделей для підвищення точності програмних рішень, а також сучасних інструментів і процесів розмітки зображень та відео з метою вдосконалення їх архітектури та пришвидшення обчислень. Розроблено дуальну архітектуру автоматизованої розмітки даних та програмне забезпечення, що її реалізує. Проведено експериментальне дослідження, яке доводить ефективність прийнятих рішень. Одним із головних викликів на шляху досягнення мети є забезпечення високої якості автоматизованої розмітки даних, наслідком якої є зменшення відсотку помилок, які необхідно виправити розмітчиком (людиною). Для розв'язання цього завдання застосовані різні техніки та методи, включаючи вперше запропоновану дуальну архітектуру, метод пріоритезації даних, ітеративний метод вибору ключових кадрів та мультимодальні нейронні мережі. Основним результатом роботи є створення дуальної архітектури програмного забезпечення для автоматизації розмітки даних та імплементація методів автоматичної розмітки відеоданих, які забезпечують високу точність розмітки та скорочення часу, необхідного для дорозмітки (уточнення розмітки, які виконуються розмітчиком після автоматизованої розмітки). Розроблені методи перевірені на реальних задачах з метою демонстрації їхньої ефективності та переваг. У першому розділі розглянуто основні аспекти детекції об'єктів, розмітки даних для задач комп'ютерного зору та програмні засоби для розмітки відеоданих. Зроблено огляд різних методів детекції об'єктів, у тому числі відомі методи, такі як R-CNN, Fast R-CNN, YOLO та інші. Описано процес розмітки даних та її значення для ефективного вирішення завдань машинного навчання. Наведено особливості розмітки даних для задач детекції об’єктів та постановлено задачу дослідження. 4 У другому розділі представлено новий метод навчання моделей машинного навчання, який використовує пріоритезацією складних екземплярів даних для навчання нейронних мереж, що збільшує точність детекції об’єктів на відео за рахунок підвищення якості набору даних. Особливістю запропонованого методу є те, що він не потребує попередньої розмітки відео для вибору складних екземплярів. У третьому розділі запропоновано новий ітеративний метод вибору ключових кадрів на довгих відео для узагальнення змісту відео. Запропонований метод зменшує кількість нерелевантних кадрів, які визначені на фазі попереднього відбору, шляхом ітеративного застосування моделі машинного навчання до відібраних кадрів з подальшою фільтрацією нерелевантних кадрів та сегментів. У четвертому розділі представлено метод агрегації знань Attr Vis, який спрямований на покращення використання знань, закодованих у великих лінгвістичних моделях (LLM) та мовних модальностях візуально-мовних моделей (VLM), для підвищення точності розпізнавання складних сцен на відео за рахунок генерації додаткових атрибутів по відео. Новизна підходу полягає у генерації атрибутів на невеликих сегментах відео, що дозволяє ефективно кодувати зміни атрибутів з часом та підвищує точність розпізнавання подій. Також було запропоновано новий алгоритм розширення лексикону, призначений для збільшення спектра атрибутів, пов’язаних з відеоданими, що підвищує точність опису подій текстовою моделлю. У п’ятому розділі проведено огляд інструментів розмітки зображень, визначено критерії для їх оцінки та наведено детальний огляд конкретних інструментів, таких як V7, LabelBox, Keylabs, LabelImg, LabelMe, Label Studio та Computer Vision Annotation Tool (CVAT). Розглянуто архітектуру інструменті розмітки CVAT, підходи автоматизації процесу розмітки даних та визначено вимоги до програмного забезпечення. Запропоновано дуальну архітектуру програмного забезпечення для автоматизації розмітки відеоданих, описано ключові компоненти системи та їх взаємодію. Наведено опис архітектури та основних її компонентів. Розроблено програмне забезпечення на базі запропонованої архітектури та методів. У шостому розділі наведено опис набору даних для проведення експериментального дослідження, визначено задачі розмітки даних, детально описано організацію процесу розмітки, інших умов проведення експерименту та наведені результати експериментального дослідження. Подано результати оцінювання швидкості та якості виконання розмітки відеоданих без автоматизації та з використанням різних підходів, включаючи нульове та активне навчання, а також підхід з використанням запропонованої дуальної архітектури. Виконано порівняння різних підходів до автоматизації розмітки відеоданих. Зроблені висновки щодо досягнення поставленої мети дисертаційної роботи. У дисертаційній роботі отримано низку нових наукових результатів: - вперше запропоновано дуальну архітектуру програмного забезпечення для автоматизованої розмітки даних, яка, за рахунок методу адаптивноагрегованого навчання нейромережі, забезпечує пришвидшення процесу розмітки та, на відміну від існуючих аналогів, дає змогу ефективного застосування нульового та активного навчання нейромережі для розмітки даних та більш гнучкого використання програмного забезпечення для різноманітних задач комп’ютерного зору; - вперше запропоновано метод пріоритезації складних зразків для навчання нейронної мережі, який, за рахунок відбору найскладніших зразків для навчання, підвищує якість набору даних без проведення попередньої розмітки відео, внаслідок чого збільшується точність детекції об’єктів на відео, та, на відміну від існуючих підходів, базується виключно на автоматично згенерованій репрезентації даних; - вперше запропоновано ітеративний метод вибору ключових кадрів на довгих відео, що дає змогу визначати ключові кадри та сегменти відео з поступовим підвищенням точності, та, на відміну від існуючих методів, враховувати динамічно зміни контенту відео для вибору ключових кадрів, підвищуючи точність сегментації та зменшуючи обсяг відеоданих для обробки; - вперше запропоновано метод агрегації знань між текстовою та візуальною частинами у візуально-мовній моделі (VLM) для обробки складних мультимодальних взаємодій, що забезпечує більш високу точність розпізнавання складних сцен на відео та їх опису у порівнянні з існуючими аналогами. Основні результати дисертаційної роботи опубліковано у 6 публікаціях, з яких 4 статті в періодичних виданнях, що проіндексовано у базі даних Scopus, 1 публікація опублікована у фаховому виданні, включених до переліку наукових фахових видань України з присвоєнням категорії «Б», та 1 публікація у матеріалах міжнародної наукової конференції.
Відкритий доступ
Методи і програмні засоби підвищення ефективності виконання запитів у високонавантажених системах
(КПІ ім. Ігоря Сікорського, 2025) Белоус, Роман Володимирович; Крилов, Євген Володимирович
Актуальність дослідження обумовлена стрімким зростанням обсягів даних та кількості запитів, що обробляються сучасними розподіленими інформаційними системами. Високонавантажені розподілені бази даних забезпечують обробку інформації в режимі реального часу, підтримуючи роботу широкого спектра застосувань – від соціальних мереж до корпоративних хмарних платформ. Однак, збільшення кількості та складності запитів створює значні труднощі у підтримці високої продуктивності та надійності. Зокрема, істотний вплив на ефективність мають мережеві затрати при передаванні даних між вузлами, коректне підтримання узгодженості даних та оптимальне розподілення навантаження. У дисертаційній роботі запропоновано науково-обґрунтовані методи та програмні засоби, що спрямовані на підвищення ефективності виконання запитів у високонавантажених розподілених системах. Для досягнення цієї мети було враховано потребу в оптимізації мережевого трафіку, вдосконаленні механізмів узгодженості даних та ефективному ребалансуванні ресурсів. Особливу увагу приділено оптимізації поведінки розподілених систем, що використовують алгоритми консенсусу Raft, оскільки саме в цих підходах закладено основу для надійного оновлення та синхронізації даних між множиною вузлів. Оптимізація Raft та пов’язаних з ним процесів передачі та узгодження даних дозволяє суттєво покращити час відгуку системи та знизити мережеве навантаження, що є критичним для стабільного функціонування високонавантажених застосувань. Вперше розроблено метод мінімізації обсягу мережевого трафіку у Raft Consensus Algorithm розподілених базах даних , який базується на поєднанні принципів, притаманних як Raft, так і Leaderless Replication та ґрунтується на 3 попередньому обміні метаданими між вузлами та в подальшому збережені отриманих результатів. Суть методу полягає в тому, що перед початком передавання основних даних, вузли спочатку обмінюються метаданими, які містять інформацію про стан кардинальності та вектори даних. Це дозволяє зменшити обсяг даних, що передаються через мережу, оскільки вузли можуть узгодити лише ті зміни, які дійсно потребують синхронізації. Після цього, на основі отриманих метаданих, відбувається локальне збереження результатів, що мінімізує кількість переданих даних, знижуючи тим самим навантаження на мережу та підвищуючи ефективність роботи алгоритму Raft у розподілених базах даних. Удосконалено метод оптимізації запитів у розподілених базах даних шляхом удосконалення ребалансування даних за допомогою генетичних алгоритмів з елітарністю та адаптивним схрещенням. Цей підхід дозволяє ефективніше розподіляти дані між вузлами системи, що зменшує час виконання запитів. Використання елітарності забезпечує збереження найкращих рішень на кожному етапі алгоритму, а адаптивне схрещення підвищує різноманітність рішень та прискорює конвергенцію до оптимального. У результаті, модифікований метод ребалансування сприяє підвищенню ефективності виконання запитів у розподілених базах даних, особливо в умовах високих навантажень. Удосконалено метод узгодженості даних у розподілених базах даних на основі методу Левенштейна, який відрізняється від існуючих підходів і мінімізує обсяг мережевого трафіку під час процесу узгодження даних, особливо при частих і малих змінах. Цей метод використовує вдосконалений метод Левенштейна, що дозволяє передавати тільки зміни замість повних копій даних. Завдяки цьому, значно зменшується кількість переданих даних по мережі, що особливо важливо в умовах частих оновлень і модифікацій невеликих обсягів текстов даних, забезпечуючи ефективну синхронізацію реплік і підтримуючи високу продуктивність системи. Для дослідження отриманих наукових результатів було розроблено спеціалізоване програмне забезпечення, яке являє собою електронний онлайнжурнал для студентів, викладачів, батьків та адміністрації навчальних закладів. 4 Цей програмний продукт дозволяє вчителям виставляти оцінки, створювати та призначати домашні завдання, а також вести звітність щодо успішності студентів. Студенти мають доступ до персонального кабінету, де відображається їхня академічна успішність, а батьки можуть отримувати доступ до інформації, що стосується їхньої дитини, включаючи оцінки та завдання. Адміністрація навчального закладу, у свою чергу, може генерувати різноманітні звіти та статистику щодо успішності студентів та інших показників. Для забезпечення ефективності, надійності та масштабованості застосунок було побудовано на основі Raft¬архітектури, яка гарантує узгодженість даних у розподіленій системі. Застосунок реалізовано з використанням сучасного стека технологій, включаючи Docker, Laravel та Vue.js. Застосування цих технологій дозволило створити гнучку, стійку до помилок і легко масштабовану систему, яка ефективно підтримує всі необхідні функції та забезпечує можливість дослідження і аналізу наукових результатів у контексті роботи розподілених систем. Дисертаційна робота складається зі вступу, 5 розділів, загальних висновків, списку використаних джерел із 47 найменувань та 2 додатків. Загальний обсяг дисертації становить 152 сторінок, з яких 126 сторінки основного тексту, містить 45 рисунків та 6 таблиць.
Відкритий доступ
Методи та програмні засоби аналізу блокчейн транзакцій
(КПІ ім. Ігоря Сікорського, 2024) Колісніченко, Вадим Юрійович; Дорогий, Ярослав Юрійович
Колісніченко В. Ю. Методи та програмні засоби аналізу блокчейн транзакцій. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії з галузі знань 12 Інформаційні технології за спеціальністю 121 Інженерія програмного забезпечення. – Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Київ, 2024. Дисертаційна робота присвячена розробці методів та засобів для аналізу блокчейн транзакцій. Розроблені методи можуть бути прямо або опосередковано застосовані як при аналізі транзакцій, так і для дослідження блокчейн мереж загалом. Аналіз блокчейн мереж, а саме блокчейн транзакцій, є важливою задачею в блокчейн індустрії. У цьому контекстізосередження уваги на блокчейн транзакціях є не лише академічним інтересом але й практичною необхідністю для забезпечення безпеки, ефективності та стійкості мережі. Розробники постійно працюють над відлагодженням роботи блокчейнвузлів, що є надзвичайно важливим для підтримки надійності мережі. Це включає в себе не тільки виявлення та усунення помилок у коді, а й оптимізацію продуктивності та масштабованості. В такому контексті аналіз транзакцій допомагає ідентифікувати та вирішувати проблеми, які можуть впливати на роботу вузлів. Дослідники використовують аналіз транзакцій для виявлення потенційно неефективних місць у мережі. Це включає в себе вивчення шаблонів трафіку, обробку запитів, а також аналіз затримок і пропускної здатності. Такий аналіз може виявити вузькі місця, що потребують оптимізації, або навіть передбачити потенційні проблеми, які можуть виникнути в майбутньому. Виявлення вразливостей через аналіз блокчейн транзакцій є важливим як для забезпечення безпеки мережі, так і для дослідження минулих атак. Це охоплює відстеження підозрілих або нестандартних транзакцій, що може вказувати на спроби шахрайства, викрадення коштів, атаки типу "відмова в обслуговуванні" (DoS) або інші безпекові загрози. Аналіз транзакцій стає ключовим інструментом у боротьбі з кіберзлочинністю та забезпеченні довіри до блокчейн технологій. Метою дисертаційної роботи є підвищення ефективності програмних засобів аналізу блокчейн транзакцій за рахунок удосконалення та розробки нових методів аналізу. У першому розділі дисертаційної роботи проаналізовано засоби та методи дослідження блокчейн транзакцій. Розглянуто області застосування такого аналізу у різних сферах та виділено основні групи задач, які він намагається вирішити: зв’язування адреси з особою, аналіз великих потоків транзакцій та аналіз смартконтрактів. Проведено порівняльний аналіз сучасних систем аналізу блокчейн транзакцій, серед яких є блокчейн-провідники та комплексні платформи дослідження транзакцій. Проведено огляд існуючих методів аналізу та їх обмежень, які вирішуються у даному дисертаційному дослідженні. У другому розділі розроблено алгоритмічне забезпечення для аналізу блокчейн транзакцій, а саме, розроблено чотири методи, які допомагають здійснювати аналіз транзакцій: метод застосування блокчейн-провідників для отримання даних з багатьох блокчейн мереж, метод виявлення та ідентифікації блокчейн вузлів, метод виявлення джерела транзакцій та метод аналізу OP_RETURN-скриптів. Третій розділ присвячено розробці архітектури комплексної системи аналізу блокчейн транзакцій, що здатна підтримувати різні типи блокчейн мереж та дозволяти вбудовувати додаткові компоненти аналізу. У розділі розглядається процес розроблення прототипів представлених методів та їх інтеграцію до комплексної аналітичної платформи. Четвертий розділ містить результати експериментального дослідження ефективності розроблених методів за допомогою реалізованих прототипів: методу застосування блокчейн-провідників для отримання даних з багатьох блокчейн мереж, методу виявлення та ідентифікації блокчейн вузлів, методу виявлення джерела транзакцій та методу аналізу OP_RETURN-скриптів. У дисертаційній роботі отримано низку нових наукових результатів, зокрема уперше розроблено архітектуру програмного забезпечення системи аналізу транзакцій блокчейн-мереж, яка відрізняється від існуючих застосуванням принципу інверсії керування, де компоненти аналізу окремих мереж ініціюють звʼязок та самостійно надсилають дані до ядра системи, що надає можливість інтеграції нових блокчейн-мереж та методів аналізу до системи. Вдосконалено метод отримання даних з блокчейн-мереж, який на відміну від наявних способів прямого отримання даних з вузлів передбачає застосування блокчейн-провідників, що надає можливість отримувати офчейн дані, які зберігаються провідником, а також уникнути розгортання власних блокчейн-вузлів під час аналізу різних мереж. Вперше здійснено формалізацію протоколу Peer Discovery блокчейн-мережі Rootstock на основі аналізу вихідного коду вузла RSKj, яка на відміну від інших включає та описує формати та послідовності повідомлень, що надає можливості для реалізації незалежних клієнтів мережі, подальшого аналізу та оптимізації даної децентралізованої системи. Вперше розроблено метод обходу вузлів блокчейн-мереж, який відрізняється від вже існуючих методів можливістю роботи з блокчейн-мережею Rootstock, що дозволяє шляхом її представлення у вигляді орієнтованого графа та послідовного опитування кожного нового виявленого вузла отримати усі доступні блокчейн вузли мережі Rootstock та її структуру. Вперше розроблено метод визначення відправника транзакцій у блокчейнмережі Rootstock через підключення до кожного знайденого вузла та аналізу часу отримання нових транзакцій, який на відміну від аналогічних методів враховує та використовує особливості мережі Rootstock, що надає можливість ідентифікувати вузол (отримати ідентифікатор та IP-адресу), який першим транслював транзакцію. Вдосконалено методологію аналізу транзакцій блокчейн-мережі Bitcoin, що на відміну від наявних підходів дозволяє автоматично виділяти різні типи OP_RETURN-скриптів на основі частоти появи їх префіксних частин та без попереднього знання форматів, що надає можливість розпізнавати та класифікувати дані, що зберігаються або протоколи, які побудовані з використанням OP_RETURN-скриптів. Запропоновані методи дозволяють підвищити ефективність аналізу блокчейн транзакцій у різних сферах, таких як розробка блокчейн систем, аудит смарт контрактів, розслідування злочинів пов’язаних з блокчейн мережами, трейдинг та інше. Основні результати дисертаційної роботи опубліковані у 4 наукових працях, зокрема, у 4 наукових статтях, з яких 2 статті опубліковано у 2 виданнях третього квартиля (Q3), які реферуються базою Scopus, 1 статті у виданні четвертого квартиля (Q4), який реферуються базою Scopus, та 1 стаття опублікована у науковому виданні, що входить до наукових фахових видань України. Запропоновані методи та прототипи впроваджені та використовуються розробниками блокчейн мережі Rootstock для аналізу динаміки вузлів та стану мережі та для аналізу безпеки.
Відкритий доступ
Методи і програмні засоби для автоматизації управління роботизованою кінцівкою
(КПІ ім. Ігоря Сікорського, 2024) Вітюк, Альона Євгеніївна; Дорошенко, Анатолій Юхимович
Вітюк А.Є. Методи і програмні засоби для автоматизації управління роботизованою кінцівкою. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 121 «Інженерія програмного забезпечення». Робота виконана на кафедрі інформатики та програмної інженерії Національного технічного університету України «Київський політехнічний інститут імені Ігоря Сікорського» Міністерства освіти і науки України. Дисертацію присвячено дослідженню програмних засобів для управління роботизованою кінцівкою та методам автоматизації процесу їх розробки з використанням алгоритмів нейроеволюції. Класичні моделі програмних засобів для управління роботизованими кінцівками базуються на точних специфікаціях завдань і точних моделях цільових об’єктів, з якими взаємодіє робот. Такі підходи гарно працюють у лабораторних умовах, проте мають обмежену придатність в умовах реального світу. Нові програмні застосунки для управління роботизованими кінцівками повинні працювати з недосконалими датчиками та виконавчими механізмами. Розробка моделей управління роботизованою кінцівкою нового покоління має бути автоматизованою, адже завдання та робочі середовища для роботів ускладнюються, зростає потреба в методах навчання та пошуку, які можуть планувати досягнення цілі, не покладаючись на вже існуючу структуру підзадач, розроблену людиною. Таким чином, вказані задачі визначають актуальну науково-технічну задачу вдосконалення теоретичних (методів) та практичних (програмних засобів) основ автоматизованої розробки адаптивних моделей управління роботизованою системою з захватним пристроєм, яка вирішується у даній дисертаційній роботі. Метою дисертаційної роботи є підвищення ефективності розроблення програмного управління роботизованою рукою, яка отримує інформацію про стан середовища з камери, шляхом використання методів автоматизації створення нейроеволюційних моделей. Результати викладено у чотирьох розділах дисертації. Перший розділ присвячено огляду та аналізу проблем автоматизованого управління роботизованою рукою робота. Розглянуто особливості взаємодії агента та середовища. Запропоновано методи навчання інтелектуального роботизованого агенту для виконання задач маніпуляції цільовими об’єктами роботизованою рукою. Розглянуто програмні засоби для навчання нейроконтролерів роботизованих систем. Другий розділ присвячено огляду методів комп’ютерного зору для обробки візуальної інформації, яка може бути використана роботизованим агентом як вхідні дані стану середовища. Розглянуто залежність точності вхідних даних з візуального сенсора та якості позиціонування роботизованої системи. Запропоновано методи та програмні засоби для оцінки впливу похибок параметрів камери на якість реконструйованої моделі середовища. Третій розділ присвячено методам нейроеволюції для управління роботизованою системою з маніпулятором. Розглянуто алгоритм NEAT для автоматизації розробки нейроконтролерів для управління роботизованою кінцівкою. Розроблено навчальне середовище для автоматизованої розробки моделі позиціонування роботизованої руки. Представлено методи адаптації нейроеволюційного підходу до використання в цільових задачах роботизованої руки. В четвертому розділі розглядається розроблення програмного засобу для адаптивного навчання контролерів роборуки на основі нейромереж з використанням методів нейроеволюціїї для задач, де вхідні дані представлені у вигляді зображень з камери. Представлена реалізація програмного рішення для навчання роботизованої руки заданої конфігурації виконання задач у тренувальних середовищах. У дисертаційній роботі отримано низку нових наукових результатів, а саме: Вперше запропоновано метод пошуку новизни в нейроеволюції для автоматизації створення моделі програмного управління роботизованою кінцівкою, що дозволяє прискорити процес розробки системи управління для нових задач роботизованої кінцівки, зокрема для адаптації конфігурації кінцівки або середовища, що підтверджується за допомогою навчання у тестових середовищах та оцінки отриманої моделі. Представлений метод відрізняється від існуючих тим, що не потребує ресурсів розробника для ручного налаштування параметрів управління роботизованою кінцівкою з метою отримання найбільш ефективної стратегії вирішення кожної окремої задачі управління. Вперше запропоновано метод навчання на основі гіперкуба для програмного управління в задачах агента-роборуки, що отримує інформацію про стан середовища з камери. Використання методу на основі гіперкуба для програмного управління агентом на основі зображень з камери покращує ефективність навчання моделі за рахунок використання відображення геометрії фенотипу субстрату штучної нейронної мережі на його шаблон зв’язків на основі гіперкубу, сприяючи розвитку більш універсальних і потужних архітектур нейронних мереж. Вперше розроблено метод підвищення якості вхідних даних з камери, які використовуються для автоматизованого управління роботизованою кінцівкою, що надає можливість навчання роботизованих агентів на тестових середовищах в умовах, що наближені до реальних, адже враховують похибки камери. Цей метод дозволяє налаштовувати конфігурацію камери у навчальній системі для адаптації моделі до реальної конфігурації роботизованої системи, що забезпечує зменшення похибок параметрів камери під час калібрування та суттєве підвищення успішності стійкого захвату кінцівкою. Практичне значення одержаних результатів полягає у експериментально підтвердженій ефективності представлених методів на відомих тестових середовищах OpenAI Gym для перевірки якості нейроеволюційних алгоритмів як для двовимірних моделей середовищ, так і для тривимірних, де інформацію про стан середовища роботизований агент отримує з камери, що наближено до роботи системи в умовах реального світу. Отримано патент на засоби калібрування камери для підвищення якості вхідних даних з камери, що використовується для автоматизованого управління роботизованою кінцівкою. Реалізовано метод пошуку новизни під час автоматизованого навчання моделі системи для двовимірного середовища та метод на основі гіперкуба для тривимірного середовища при виконанні маніпуляційних задач роботизованою кінцівкою. Встановлено, що використання представлених методів у нейроеволюційному процесі для вирішення задачі позиціонування дозволяє підвищити ефективність процесу навчання мережі та отримати оптимальну топологію управляючої мережі. Основні результати дисертаційної роботи опубліковано у 9 наукових працях, зокрема, у 5 наукових статтях, з яких 4 статті опубліковано у фахових виданнях, включених до переліку наукових фахових видань України з присвоєнням категорії «Б», та 1 статтю у інших виданнях. Крім того, 3 статті у матеріалах науково-технічних конференцій. Також опубліковано 1 патент.
Відкритий доступ
Мова програмування та програмні засоби опису агентних моделей розповсюдження інфекційних захворювань
(КПІ ім. Ігоря Сікорського, 2023) Сарнацький, Владислав Віталійович; Баклан, Ігор Всеволодович
Сарнацький В.В. Мова програмування та програмні засоби опису агентних моделей розповсюдження інфекційних захворювань. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 121 – Інженерія програмного забезпечення та 12 – Інформаційні технології. – Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського», Київ, 2023. Дисертаційна робота присвячена розробці інструментального забезпечення для ефективного моделювання процесів розповсюдження інфекційних захворювань. Висвітлено основні напрями та тенденції розвитку сфери епідеміологічного моделювання у цілому та зокрема процесу розробки агентних епідеміологічних моделей. Були виявлені переваги та недоліки запропонованих дослідницькою спільнотою рішень та, зокрема, обсяг, гнучкість та швидкодія програмних засобів моделювання. Серед програмних засобів моделювання не було помічено представників, що поєднують у собі доступний інтерфейс з високою швидкодією та гнучкістю опису моделей. Був зроблений висновок, що розробка предметно-орієнтованої мови програмування для опису агентних моделей та графічного середовища розробки та аналізу нададуть доступний інтерфейс опису моделі у поєднанні зі значною гнучкістю та швидкодією. Виконана побудова загального математичного апарату епідеміологічної моделі агентного типу. У рамках математичної моделі була сформульована основна складність агентного епідеміологічного моделювання, а саме урахування контактів під час обчислення розподілу майбутнього стану захворювання. Запропоновано три алгоритми обчислення цього розподілу, проаналізована їх алгоритмічна складність. Також, для одного з них – алгоритму з групуванням було виконане дослідження оптимальної його імплементації. З огляду на розроблену математичну модель було дано визначення формальної граматики предметно-орієнтованої мови опису агентної епідеміологічної моделі CTrace. Мова надає вбудований високорівневий інтерфейс для задання основних сутностей заданої загальної епідеміологічної моделі, а також відношень між ними. Мова підтримує задання ймовірнісних розподілів різного типу та основні операції між ними що значно спрощує задання соціодемографічної параметризації моделей. Виконана побудова транслятора розробленої формальної мови опису агентної епідеміологічної моделі. Розроблений транслятор є компілятором із конфігурованою проміжною мовою. Такою мовою може бути Python, який своєю чергою транслюється у мову машинних інструкцій під час процесу JIT-компіляції, або будь-яка мова загального призначення, що має інтерфейс до побудови Pythonмодулів. Такою мовою була обрана мова Rust. Основним аспектом алгоритму трансляції є мінімізація кількості виділень пам’яті у процесі виконання результівної програми. Для цього, компілятор обраховує загальний обсяг пам’яті, необхідний для роботи моделі, і використовує буфер відповідного розміру для організації усіх обчислень. Розроблене середовище розробки та аналізу агентних епідеміологічних моделей з використанням мови CTrace – CTraceEnv. Розроблене середовище надає базовий функціонал необхідний для підтримки процесу опису моделей мовою CTrace, що включає підсвітку синтаксису вихідного коду, вбудований транслятор тощо. Серед функціоналу аналізу представлені елементи керування роботою моделі, значень її глобальних параметрів, інтерфейс перегляду динаміки розповсюдження досліджуваного інфекційного захворювання, а також функціонал експорту результатів для подальшого аналізу сторонніми спеціалізованими інструментами. Проведений аналіз розробленої мови опису агентних епідеміологічних моделей з боку доцільності її використання, обсягу сценаріїв, що можуть бути змодельовані, ефективності розробки та використання Виконана практична апробація розробленого інструментарію для ефективного моделювання розповсюдження інфекційних захворювань. У її рамках, було дано визначення агентної епідеміологічної моделі розповсюдження коронавірусу SARS-CoV-2 серед населення Польщі у період з початку вересня 2020 року до кінця листопада 2020 року, що була відкалібрована з використанням публічно доступних епідеміологічних даних. Результівна модель описує динаміку зміни кількості інфікованих людей з коефіцієнтом детермінації рівним 0.9319, що свідчить про здатність розробленого підходу описувати процеси розповсюдження інфекційних захворювань. Проведений аналіз впливу соціодемографічної гетерогенності середовища моделювання на якість карантинних стратегій побудованих на його основі. Відповідний експеримент полягав у реалізації алгоритму пошуку карантинних стратегій для заданої агентної епідеміологічної моделі країни Європейського Союзу. Соціодемографічна параметризація моделі побудована з використанням статистичного моделювання на основі відкритих історичних даних, з відкритої бази статистичних даних Eurostat. Знайдені алгоритмом стратегії були порівняні із тривіальними, що показало більшу їх ефективність та використані у процесі перехресного порівняння. Для цього, стратегія, отримана з моделі країни тестування була порівняна з іншими. В обох випадках критерієм порівняння виступала сумарна винагорода за дії агента, що використовує відповідну стратегію у середовищі моделювання, сформульованим як Марківський процес вирішення. Аналіз показав, що для покращення їх якості соціодемографічні показники мають бути ураховані, що, своєю чергою, показує необхідність наявності їх задання у будь-якому інструменті епідеміологічного моделювання. Це свідчить про доцільність тої уваги, що була приділена процесу їх задання при розробці мови CTrace. Окремо був проведений якісний аналіз спектра сценаріїв, що можуть бути змодельовані з використанням мови CTrace. Показано моделювання таких аспектів агентного епідеміологічного моделювання як: динамічні параметри моделі та її сутностей, географія середовища, погодні умови, векторні захворювання. Аналіз ефективності розробки епідеміологічних моделей мовою CTrace показав значне скорочення обсягу вихідного коду програми у порівнянні з моделями імплементованими мовами програмування загального призначення. В якості цих моделей, був використаний лістинг програмного коду проміжною мовою, що генерується транслятором. Скорочення обсягу програмного коду становило від 14 до 34 разів для мови Python та від 16 до 45 разів для мови Rust. Це скорочення може свідчити про зменшення кількості людино-годин необхідних для їх розробки, а також збільшену швидкість ітерування. Окрім цього, зменшення обсягу вихідного коду призводить до зменшення кількості помилок, що, своєю чергою, зменшує час опису моделей. Дано визначення метрики функціональності інструменту епідеміологічного моделювання, що дозволяє оцінити обсяг сценаріїв та функцій доступних користувачу. Дано визначення метрики ефективності моделі, що дозволяє виконувати порівняння різних моделей та інструментів моделювання з точки зору їх обчислювальної ефективності. Ця метрика є інваріантною до кількості агентів, тривалості симуляції, її гранульованості та кількості одночасно залучених до обчислення моделі ядер центрального процесору. Аналіз швидкодії результівних моделей, заданих мовою CTrace, ставив дві мети: обґрунтувати доцільність використання мови Python як проміжної мови трансляції, а також порівняти їх швидкодію з наявними моделями. Показано, що використання мови Python з бібліотекою для JIT-компіляції Numba дозволяє отримати швидкодію моделей, порівняну з отриманою у разі використання мови Rust, ефективність якої порівняна з C/C++. При цьому, гнучкість мови Python дозволяє відносно просто вносити корективи у процес трансляції. Експерименти з використанням різних тестових середовищ показали, що існуючі епідеміологічні моделі не виграють у швидкодії у розроблених мовою CTrace еквівалентів. З результатів порівняння розробленого середовища CTraceEnv з аналогами за визначеними метриками ефективності та функціональності можна зробити висновок що обсяг функцій агентного епідеміологічного моделювання наданий CTraceEnv є значно більшим за аналоги й приблизно відповідає середовищу NetLogo, надаючи при цьому ефективність результівних моделей, що не програє аналогам.
Відкритий доступ
Методи та програмні засоби багатовимірної поліноміальної регресії за надлишковим описом на основі побудови одновимірної регресії з використанням ортогональних поліномів Форсайта
(КПІ ім. Ігоря Сікорського, 2023) Головченко, Максим Миколайович; Павлов, Олександр Анатолійович
Головченко М.М. Методи та програмні засоби багатовимірної поліноміальної регресії за надлишковим описом на основі побудови одновимірної регресії з використанням ортогональних поліномів Форсайта. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 121 – Інженерія програмного забезпечення з галузі знань 12 – Інформаційні технології. – Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського», Київ, 2023. Дисертаційна робота присвячена розробці універсального синтетичного методу оцінок коефіцієнтів багатовимірної поліноміальної регресії, заданої надлишковим описом та створенням оригінальних програмних засобів, що ефективно реалізують цей метод. У процесі розробки та дослідження ефективності синтетичного методу були отримані такі результати. Вперше розроблено синтетичний метод побудови багатовимірної поліноміальної регресії, заданої надлишковим описом, що відрізняється від існуючих тим, що органічно поєднує риси класичного методу (теоретично обґрунтовані випадки, в яких оцінка коефіцієнтів при нелінійних членах знаходиться з заданою точністю) з ефективністю евристичних методів (знаходження структури регресії з використанням перевірочної послідовності в модифікованому методі групового урахування аргументів, що входить в склад синтетичного методу), а також включає в себе метод побудови одновимірної поліноміальної регресії на основі довільного повторного активного експерименту з використанням лише одного набору нормованих ортогональних поліномів Форсайта, декомпозиційний метод оцінки коефіцієнтів при нелінійних членах багатовимірної поліноміальної регресії з наперед заданою точністю, що багатовимірну задачу зводить до послідовної побудови відповідних одновимірних поліноміальних регресій. Вперше обґрунтовано можливість знаходження нормованих ортогональних поліномів Форсайта з наперед заданою точністю, яка досягається за рахунок представлення даних у вигляді раціональних дробів та застосування до них символьних обчислень, що дозволяє отримати оцінки коефіцієнтів при нелінійних членах багатовимірної поліноміальної регресії, значення яких відповідають теоретично виведеним умовам. Вперше приведено теоретичне обґрунтування зменшення обчислювальної складності програмного забезпечення реалізації методу найменших квадратів на основі повторних експериментів, що полягає в заміні операцій з матрицями повного активного експерименту операціями з матрицями основного експерименту суттєво меншої розмірності. Вперше запропоновано архітектуру кросплатформної бібліотеки для реалізації синтетичного методу та його складових, яка дозволяє використовувати її компоненти, як окремо, так і в цілому для розв'язання прикладних задач побудови регресійних моделей. Проведено дослідження ефективності алгоритмів, що реалізують операції з матрицями в методі найменших квадратів, зокрема обґрунтовано можливість використання паралельних обчислень. Розглядаються матричні операції, які входять у формулу для знаходження оцінок коефіцієнтів багатовимірної поліноміальної регресії методом найменших квадратів як складової модифікованого методу групового урахування аргументів та можуть виконуватись ефективніше при застосуванні паралельних обчислень. Було виконано дослідження ефективності алгоритмів множення матриць та обернення матриць, як складових задачі знаходження оцінок коефіцієнтів багатовимірної поліноміальної регресії модифікованим методом групового урахування аргументів. Це дослідження ефективності алгоритмів виконувалось шляхом реалізації алгоритмів на базі 8-ми ядерного мікропроцесора Apple M1 та фіксації часу роботи різних алгоритмів для фіксованої кількості потоків та квадратних матриць заданої розмірності. Приведено обґрунтування можливості розпаралелювання обчислень в модифікованому методі групового урахування аргументів для знаходження оцінок коефіцієнтів часткових описів та залишкових сум квадратів. Реалізовано кросплатформну бібліотеку та її програмний інтерфейс для побудови регресійних моделей. Так, для користувачів, які володіють базовими навичками у області програмування і статистичного аналізу та бажають отримати розв’язок задачі побудови багатовимірної поліноміальної регресії достатньо у автоматизованому режимі підключити кросплатформну бібліотеку у власний застосунок та передати у її функції бібліотеки вхідні дані. В цьому випадку функції кросплатформної бібліотеки аналізують надлишковий опис і визначають, що він відноситься до класу, у якому всі лінійні системи мають лише одну змінну, якщо це не так, то задача розв’язується повністю модифікованим методом групового урахування аргументів. У протилежному випадку, програма аналізує можливості декомпозиційного методу та видає вимоги для проведення відповідної кількості повторних активних експериментів для побудови одновимірних поліноміальних регресій та множину коефіцієнтів, які будуть оцінені. Далі формується багатовимірна поліноміальна регресія задана надлишковим описом, яка буде розв’язана модифікованим методом групового урахування аргументів. Для користувачів, які володіють розширеними навичками у області програмування і статистичного аналізу та бажають отримати розв’язок задачі побудови багатовимірної поліноміальної регресії, повинні ознайомитись з детальною інструкцією по роботі з кросплатформною бібліотекою, у якій описані теоретичні положення та практичні рекомендації з використання синтетичного методу. Далі користувачі за допомогою функцій кросплатформної бібліотеки у частині декомпозиційного методу можуть запрограмувати індивідуальний алгоритм розв’язку задачі на основі теоретичних положень синтетичного методу. У частині модифікованого методу групового урахування аргументів все залишається без змін. За результатами виконання синтетичного методу користувачу буде виданий кінцевий результат, який містить структуру багатовимірної поліноміальної регресії, знайдені декомпозиційним методом оцінки коефіцієнтів багатовимірної поліноміальної регресії та їх дисперсії та оцінки коефіцієнтів багатовимірної поліноміальної регресії з оцінками їх дисперсій, знайдені за допомогою модифікованого методу групового урахування аргументів, з оцінкою результатів – має високу ступінь достовірності; задовільну ступінь достовірності; результат недостовірний. При розробці кросплатформної бібліотеки, що реалізує синтетичний метод, використовувались такі допоміжні засоби. В якості мови реалізації кросплатформної бібліотеки була обрана Python, оскільки дана мова програмування краще за інші підходить для реалізації data science та статистичних методів обробки даних. Крім того для мови Python існує великий набір високорівневих фреймворків різного призначення та програмних бібліотек, які можна використовувати у якості допоміжних засобів при розробці. Середовищем розробки кросплатформної бібліотеки було обрано IntelliJ IDEA через наявність безкоштовної експрес-версії та зручність встановлення допоміжних програмних пакетів та бібліотек. У якості архітектури кросплатформної бібліотеки було використано монолітну архітектуру, оскільки решта архітектур програмного забезпечення – багаторівнева, клієнт-серверна, мікросервісна, сервісно-орієнтована – не рекомендується для використання при розробці такого роду програмного забезпечення. Внутрішня логіка бібліотеки побудована з використанням компонентно-орієнтованого підходу, так як даний підхід добре себе зарекомендував при розробці програмного забезпечення цільового призначення, що використовується при розробці цільового прикладного програмного забезпечення. В якості пакету для паралельної реалізації деяких підалгоритмів було використано multiprocessing, а для реалізації символьних обчислень було використано бібліотеку SymPy. Для розгортання кросплатформної бібліотеки було використано систему управління пакетами pip. Це універсальна, зручна і найбільш популярна система управління пакетами, написаними для мови програмування Python. В результаті розгортання користувачі зможуть завантажувати і встановлювати бібліотеку для своїх потреб командою pip install regression_lib_mpr у своєму середовищі розробки. Дисертаційна робота складається зі вступу, чотирьох розділів, загальних висновків, списку використаних джерел із 84 найменувань на дев’яти сторінках та чотирьох додатків. Загальний обсяг дисертації становить 185 сторінок, з яких 128 сторінок основного тексту, містить 23 рисунки та 24 таблиці.
Відкритий доступ
Методи візуального програмування Петрі-об'єктних моделей
(КПІ ім. Ігоря Сікорського, 2022) Дифучин, Антон Юрійович; Жаріков, Едуард В‘ячеславович
Дисертаційна робота присвячена розробці методів та засобів візуального програмування моделей дискретно-подійних систем, формалізованих у вигляді Петрі-об‘єктної моделі. Візуальне програмування є способом розробки програм, що використовує візуальні об‘єкти для опису завдання на виконання обчислень. Для того, щоб візуальне представлення стало візуальним програмуванням необхідно гарантувати однозначне перетворення візуального представлення у обчислення. Таку однозначність перетворення гарантує розробка формальної мови програмування. На сьогоднішній день положення теорії формальних мов сформульовані в припущенні, що мова є текстовою, і адаптації цих положень до мови програмування, в якій символами є елементи візуального представлення, є невирішеним завданням. Особливе місце візуальні засоби представлення займають у програмних засобах з імітаційного моделювання, оскільки слугують не тільки для конструювання моделі, але й для її відлагодження та представлення кінцевого результату імітації. Існуючі програмні засоби з імітаційного моделювання широко застосовують графічні редактори для конструювання моделі з блоків або з більш низькорівневих елементів, наприклад, елементів мережі Петрі. Процес розробки моделі у графічному редакторі є трудомістким і довготривалим, а у випадку великої кількості елементів часто є неможливим, оскільки потребує великого обсягу рутинної роботи з елементами та налаштуванням їх параметрів. Імітаційні моделі є одним з потужних інструментів обробки даних з метою пошуку оптимальних умов або короткострокового прогнозування. У поєднанні з даними, що постачаються у реальному часі, вони можуть стати потужним компонентом сучасних систем прийняття рішень та управління. Тому розробка нових методів та програмних засобів, що спрямовані на підвищення ефективності процесу програмної реалізації моделі за рахунок автоматизації кодування, є актуальним науковим завданням. Метою наукового дослідження є підвищення ефективності програмних засобів представлення складних моделей систем для цілей імітаційного моделювання за рахунок зменшення складності конструювання моделі та збільшення швидкодії алгоритмів імітації, зручності сприйняття моделі, зменшення кількості помилок при створенні зв‘язків між елементами моделі та зменшення часу на модифікацію моделі. У першому розділі наведено огляд існуючих програмних засобів моделювання систем стохастичними мережа Петрі та обґрунтовано розробку мови візуального програмування. Виявлено, що графічні редактори не вирішують низку проблем: неможливість коригування параметрів моделі без коригування її візуального представлення, неможливість тиражування однотипних елементів у великій кількості (оскільки усі вони будуть займати візуальний простір), неможливість тиражування зв‘яків при повторному використанні фрагментів мережі Петрі, неможливість налаштування параметрів елементів без коригування кожного окремого параметра у спеціально відведеному для цього вікні. У другому розділі наведені відомості з теорії стохастичних мереж Петрі та основні теоретичні положення Петрі-об‘єктного моделювання. Формальний опис Петрі-об‘єктної моделі розвинутий за рахунок введення понять конектора Петрі-об‘єктів, групи Петрі-об‘єктів, колекції Петрі-об‘єктів. Введені поняття відкривають можливість тиражування зв‘язків при конструюванні Петріоб‘єктної моделі. Проте відсутність візуального представлення моделі робить процес розробки моделі складним через рутинні та схильні до помилок операції кодування зв‘язків між елементами. У третьому розділі представлена формальна граматика мови Петріоб‘єктного моделювання, яка розроблена. Алфавіт мови складається з графічних елементів візуального представлення, а дозволені мовою набори графічних елементів утворюють лексеми мови. Синтаксис мови визначений правилами виведення граматики, в основі яких правила утворення триплетів елементів. Для розробленої контекстно-вільної граматики встановлено, що вона є однозначною і приведеною. Наведений приклад розробки моделі інформаційної системи розробленою мовою. У четвертому розділі представлена розробка транслятора мови візуального програмування Петрі-об‘єктних моделей. На клієнтській частині веб застосування реалізована частина транслятора, що відповідає за лексичний та синтаксичний аналіз мовного виразу. На серверній частині веб застосування реалізована частина транслятора, що виконує семантичний аналіз мовного виразу. Для передачі даних між клієнтом та сервером використовується JSON формат. У розділі представлена інтерпретація символів алфавіту мови візуального програмування Петрі-об‘єктних моделей мовою TypeScript. Запуск на обчислення відбувається після перетворення отриманих у форматі JSON даних в об‘єкт PetriObjModel бібліотеки Петрі-об‘єктного моделювання PetriObjLIb. Обчислення Петрі-об‘єктної моделі – це відтворення подій в часі алгоритмом імітації. П’ятий розділ містить результати експериментального дослідження процесу розробки моделей, точності моделювання та швидкодії обчислення моделі. Результати, отримані у дисертаційному дослідженні, містять наукову новизну. Вперше розроблено візуальну мову програмування Петрі-об‘єктних моделей, яка дозволяє спростити процес побудови моделей, підвищити наочність сприйняття моделей та час виконання імітаційного моделювання шляхом організації дворівневого способу побудови моделей. На відміну від існуючих рішень в області імітаційного моделювання, візуальна мова програмування Петрі-об‘єктних моделей надає універсальний та гнучкий інструмент для побудови моделей дискретно-подійних систем, а процес виконання імітаційного моделювання не залежить від обчислювальних ресурсів користувача. Удосконалено Петрі-об‘єктну модель за рахунок введення поняття групи Петрі-об‘єктів, колекції Петрі-об‘єктів та групи колекцій Петрі-об‘єктів, що, на відміну від існуючих засобів представлення імітаційної моделі, надають можливість тиражувати Петрі-об‘єкти з заданими наборами параметрів, тиражувати колекції взаємопов‘язаних Петрі-об‘єктів та тиражувати зв‘язки між Петрі-об‘єктом та групою Петрі-об‘єктів, між Петрі-об‘єктом та групою колекцій Петрі-об‘єктів. За рахунок тиражування однотипних фрагментів моделі та тиражування зв‘язків створюються умови для швидкого конструювання моделей з великою кількістю елементів та значно скорочується обсяг їх візуального представлення. Вперше запропоновано клієнт-серверну архітектуру серед програмного забезпечення з імітаційного моделювання на основі Петрі-об‘єктного підходу, використання якої дозволяє задіяти ресурси віддаленого серверу для проведення імітаційного моделювання для забезпечення стабільного часу виконання, зменшення витрат на інфраструктуру обчислювальних ресурсів серед користувачів та організації спільного доступу до розробки моделей. Результати дисертаційної роботи опубліковано у 7 наукових публікаціях, серед яких 1 стаття у періодичному науковому виданні, проіндексованому у Web of Science Core Collection та Scopus базах даних, 2 статті у фаховому науковому журналі категорії «Б», 1 стаття у фаховому науковому журналі категорії «В», 1 стаття у науковому журналі, проіндексованому GoogleScholar, 2 публікації у матеріалах міжнародних наукових конференцій, проіндексованих у Scopus.

Переглянути

Нові надходження