Магістерські роботи (ШІ)
Постійне посилання зібрання
У зібранні розміщено магістерські дисертації на здобуття ступеня магістра.
Переглянути
Нові надходження
Документ Відкритий доступ Platform for Medical Data Processing and Treatment Plan Management(Igor Sikorsky Kyiv Polytechnic Institute, 2025) Damaskina, Olena Ihorivna; Sineglazov, Viktor MykhailovychMaster’s thesis: 122 pages, 2 figures, 2 tables, 70 references, 2 appendices. The object of research is the processes of medical data processing, integration, and management in modern healthcare information systems using artificial intelligence technologies. The subject of research is architectural, algorithmic, and software methods for developing medical platforms for medical data processing, medical image analysis, treatment plan formation and management, as well as quality assurance and validation of AI components. The purpose of the research is to develop and study a platform for medical data processing and treatment plan management with integrated artificial intelligence and Explainable AI modules, ensuring reliability, interpretability of results, and data quality control. The relevance of the research is driven by the rapid digital transformation of healthcare and the increasing volume of medical data, particularly medical images, which require automated, reliable, and interpretable processing. At the same time, significant challenges remain related to data integration, data quality, AI result validation, and compliance with regulatory requirements. The scientific novelty of the research consists in: (1) a systematic approach to the design of a medical platform covering the full medical data lifecycle; (2) integration of AI-based medical image analysis with Explainable AI mechanisms to improve transparency and trust in the results; (3) formalization of quality control and validation points at different levels of the system architecture. The practical value of the research lies in the developed prototype of a medical platform that can be used for medical data processing, ophthalmological image analysis, and support of treatment plan management processes. The proposed architecture provides modularity, scalability, compliance with medical data standards, and the ability to integrate with existing healthcare information systems.Документ Відкритий доступ Інтелектуальна система розпізнавання емоцій за виразами обличчя на основі згорткових нейронних мереж(КПІ ім. Ігоря Сікорського, 2025) Панасенко, Володимир Володимирович; Тимощук, Оксана ЛеонідівнаМагістерська дисертація: 106 с., 18 Рисунок, 24 посилань, 1 додаток. Об’єкт дослідження – процес автоматизованого розпізнавання емоцій людини за зображеннями облич. Предмет дослідження – моделі, методи та архітектури згорткових нейронних мереж (CNN) для задачі класифікації емоцій (FER), а також методи попередньої обробки даних та метрики оцінювання якості. Мета роботи – дослідження предметної області розпізнавання емоцій. Розробка та оцінка архітектури згорткової нейронної мережі для класифікації емоцій на 7 класів, включаючи підготовку даних, вибір функції втрат та аналіз метрик (Accuracy, F1-score). У роботі здійснено огляд теоретичних основ розпізнавання емоцій, розглянуто категоріальні та дименсійні моделі емоцій, проаналізовано класичні та сучасні підходи до FER. Побудовано повний пайплайн обробки даних, що включає завантаження, препроцесинг, аугментації, формування навчальних, валідаційних і тестових вибірок. Розроблено згорткову нейронну мережу для обробки зображень розміром 48×48 у відтінках сірого та виконано її навчання з використанням методів регуляризації, ранньої зупинки та адаптивного керування швидкістю навчання. Проведено експериментальну оцінку системи за допомогою метрик точності, F1-міри та матриці плутань. У роботі також розглянуто напрями вдосконалення системи, зокрема покращення якості даних, балансування класів, оптимізацію архітектури, багатозадачне навчання, а також можливості практичного впровадження у вигляді програмного продукту та стартап-проєкту.Документ Відкритий доступ Виявлення контрастних об'єктів з використанням комбінації напівконтрольованого та неконтрольованого навчання(КПІ ім. Ігоря Сікорського, 2025) Степанчук, Дмитро Костянтинович; Пишнограєв, Іван ОлександровичМагістерська дисертація: 107 с., 4 рисунки, 13 таблиць, 50 джерел, 1 додаток. Об'єкт дослідження – процеси розмітки даних для систем комп'ютерного зору в умовах обмежених маркованих даних. Предмет дослідження – методи напівкерованого навчання та системи напівавтоматичної розмітки з алгоритмічною передрозміткою та механізмами консенсусу. Мета роботи – розробка ефективної системи напівавтоматичної розмітки даних, що поєднує алгоритмічний холодний старт, контроль якості на основі консенсусу та поступове навчання моделей. Актуальність роботи полягає у зростаючому попиті на марковані датасети, тоді як ручна розмітка залишається дорогою та трудомісткою. Наукова новизна полягає у: (1) розробці комбінованого підходу холодного старту з інтеграцією множинних алгоритмів детекції; (2) впровадженні автоматизованої системи консенсусу з динамічною пріоритезацією; (3) інтеграції напівкерованого та активного навчання для поступового покращення. Практична цінність полягає у готовому програмному забезпеченні, що суттєво скорочує час розмітки через алгоритмічну передрозмітку при забезпеченні якості через автоматизований консенсус. Модульна архітектура підтримує стандартні формати та гнучкі варіанти розгортання. Комерційний потенціал підтверджується швидким зростанням ринку розмітки даних з життєздатною бізнес-моделлю SaaS, орієнтованою на AI/ML компанії в різних галузях. Публікація за темою дослідження увійшла до збірника матеріалів IV Всеукраїнської науково-практичної конференції «Системні науки та інформатика».Документ Відкритий доступ Інтелектуальна система діагностики остеопорозу на основі обробки DXA-зображень(КПІ ім. Ігоря Сікорського, 2025) Семенов, Олексій Геннадійович; Синєглазов, Віктор МихайловичМагістерська дисертація: 100с., 19 рис., 29 табл., 14 посилань. Об’єкт дослідження– класифікація остеопорозу на основі DXA-зображень. Предмет дослідження–методи виявлення остеопорозу. Мета роботи– створити систему для покращення діагностики остеопорозу за допомогою поєднання традиційного показника aBMD з методом аналізу варіограмних та трабекулярного характеристик DXA-зображень. У роботі розглянуто сучасні підходи до діагностики DXA-зображень, проаналізовано обмеження показника aBMD та встановлено, що він не дає можливості повністю оцінити структурну цілісність кістки. Описано можливості текстурного аналізу DXA-зображень із застосуванням варіограмних параметрів sill variance, correlation length та degree of anisotropy, а також показано їх зв’язок із мікроархітектурою та структурою поперекових хребців. У рамках роботи розроблено інтелектуальну систему класифікації остеопорозу на основі багатоканального представлення DXA-зображень, що поєднує карту локальної щільності та варіограмні параметри. У результаті отримано модель, яка забезпечує підвищення точності виявлення остеопоротичних змін, навіть у випадках коли значення aBMD знаходиться в остопенічному діапазоні, за рахунок аналізу глибинних структурних ознак мікроархітектури. Запропонований підхід, який може бути використаний у клінічній практиці як додатковий інструмент оцінки стану кісткової тканини та прогнозування ризику компресійних переломів.Документ Відкритий доступ Багатодокументне резюмування тексту з використанням нейромережевих методів(КПІ ім. Ігоря Сікорського, 2025) Панасюк, Ярослав Ігорович; Пишнограєв, Іван ОлександровичМагістерська дисертація: 87 с., 6 рисунків, 16 таблиць, 82 джерела, 1 додаток. Об’єкт дослідження – процес автоматизованої обробки та узагальнення текстових відгуків користувачів у системах електронної комерції. Предмет дослідження – методи та алгоритми аспектно-орієнтованого узагальнення (Aspect-Based Sentiment Summarization), метрики оцінювання фактичної узгодженості згенерованого тексту. Мета роботи – розробка методології та архітектури системи для трансформації відгуків користувачів у кількісне аспектно-орієнтоване резюме (Quantified Aspect-Based Summary – QABS). Актуальність роботи полягає у необхідності достовірного й інофрмативного резюмування надмірної кількості відгуків користувачів. Наукова новизна полягає у: (1) впроваджені стандарту кількісного аспектно-орієнтованого резюмування; (2) розробці архітектури системи для реалізації кількісного аспектно-орієнтованого резюмування; (3) впроваджені метрик оцінювання фактичної узгодженості згенерованого тексту. Практична цінність полягає у готовому стандарті та метриках оцінювання резюмування відгуків. Комерційний потенціал підтверджується високим попитом на інформативні відгуки користувачів як серед покупців, так і продавців товарів та послуг. Публікація за темою дослідження увійшла до збірника матеріалів IV Всеукраїнської науково-практичної конференції "Системні науки та інформатика".Документ Відкритий доступ Метод розпізнавання іменованих сутностей в українській мові з малою кількістю навчальних прикладів(КПІ ім. Ігоря Сікорського, 2025) Кашперова, Софія Володимирівна; Шаповал, Наталія ВіталіївнаМагістерська дисертація: 132с., 14 рис., 19 табл., 49 посилань, додаток. Об’єкт дослідження – процес розпізнавання іменованих сутностей в українських текстах. Предмет дослідження – метод розпізнавання іменованих сутностей з малою кількістю навчальних прикладів. Мета дослідження – розробити та експериментально оцінити метод розпізнавання іменованих сутностей в українських текстах з малою кількістю навчальних прикладів, порівняти ефективність з великими мовними моделями. Новизна: запропонований метод раніше не застосовувався для розпізнавання іменованих сутностей; на момент розробки програмного продукту не існує відкритих моделей, що працюють у zero-shot/few-shot режимі й спеціально навчені для української мови. У даній роботі було реалізовано метод з модулем, який поєднує контекстні подання токенів тексту з поданнями текстових промптів класів сутностей та модулем, що підвищує розрізнювальну здатність моделі за рахунок явного моделювання як подібності, так і відмінностей між поданнями. Практичне значення роботи полягає у створенні прототипу NER системи, що підтримує українську, може застосовуватися для попередньої обробки текстових даних у задачах аналітики, пошуку, чат-ботів та інформаційного видобування, а також розширенні розмічених корпусів українською мовою.Документ Відкритий доступ Інтелектуaльнa системa визнaчення взaємодії між лікaми(КПІ ім. Ігоря Сікорського, 2025) Мaцуєв, Ромaн Олексaндрович; Синєглaзов, Віктор МихaйловичСтруктура та обсяг роботи. Робота складається з трьох розділів, містить 94 сторінки, 10 рисунків, 17 таблиць, 45 посилань. Актуальність теми. Прогнозування взаємодії лікарських засобів (DDI) є актуальним завданням фармакології та клінічної медицини через ризик побічних реакцій і зниження ефективності лікування. Зростання поліпрогмазії зумовлює потребу в автоматизованих високоточних методах прогнозування. Наявні підходи, орієнтовані переважно на одномодальні ознаки, не забезпечують ефективного моделювання складних нелінійних взаємозв’язків між гетерогенними фармакологічними та хімічними даними. Мета роботи. Підвищення точності багатоміткового прогнозування подій DDI шляхом розробки моделі DDI-TransMDL на основі архітектури Трансформер-Енкодера для інтеграції мультимодальних ознак. Методи дослідження. Застосовано методи системного аналізу та глибокого навчання, зокрема Трансформер-Енкодер з механізмом Multi-Head Self-Attention. Реалізовано інжиніринг ознак із включенням коефіцієнта Жаккарда та оцінювання моделі за допомогою 5-Fold Cross-Validation і багатоміткових метрик Micro/Macro F1-Score, ROC-AUC та AUPR. Наукова новизна. Запропоновано архітектуру DDI-TransMDL для інтеграції чотирьох гетерогенних модальностей (SMILES, Target, Enzyme, Pathway) у задачі прогнозування DDI, а також метод включення коефіцієнта Жаккарда у вхідний вектор ознак. Практична цінність. Модель демонструє високу прогностичну ефективність (Micro ROC-AUC ≈ 0.9893, Micro AUPR ≈ 0.8351) та може використовуватися для багатоміткового прогнозування 65 подій DDI у фармаконагляді та клінічних дослідженнях.Документ Відкритий доступ Класифікація гіперспектральних зображень з використанням nnPU функції втрат та маскованого автоенкодера(КПІ ім. Ігоря Сікорського, 2025) Мелащенко, Олександр Сергійович; Пишнограєв, Іван ОлександровичМагістерська дисертація: 74 сторінки, 2 рисунків, 13 таблиць, 28 посилань, додаток. Об’єкт дослідження: гіперспектральні зображення, які використовуються для аналізу спектральної інформації різних об'єктів та матеріалів. Предмет дослідження: алгоритми класифікації гіперспектральних зображень, що базуються на nnPU функції втрат та маскованого автоенкодера. Мета роботи: дослідити існуючі методи класифікації гіперспектральних зображень, розробити метод класифікації гіперспектральних зображень за допомогою nnPU функції втрат та маскованого автоенкодера. Результати роботи: Оглянуто та проаналізовано сучасні методи класифікації гіперспектральних зображень. Розроблено метод класифікації гіперспектральних зображень на основі nnPU функції втрат та маскованого автоенкодера. Реалізовано та протестовано запропонований підхід на гіперспектральних даних. Проведено порівняльний аналіз розробленого методу з класичними конкурентоспроможність.Документ Відкритий доступ Побудова деталізованих 3D карт на основі моделей YOLO(КПІ ім. Ігоря Сікорського, 2025) Мірошниченко, Михайло Андрійович; Данилов, Володимир ЯковлевичМагістерська дисертація: 131 ст., 4 рис., 26 табл., 21 посилань, додаток. Об’єкт дослідження – система побудови тривимірних карт на основі RGB-D даних у динамічних середовищах. Предмет дослідження – методи комп’ютерного зору та глибинного навчання, що інтегруються у SLAM-пайплайн для підвищення робастності до рухомих об’єктів. Метою роботи є розробка та аналіз нейромережевої системи Visual SLAM, яка забезпечує точне тривимірне картування в присутності динамічних об’єктів завдяки використанню YOLOv8, ByteTrack та TSDF-ф’южну. Розглянуто сучасні підходи до SLAM у динамічних середовищах, проаналізовано переваги та обмеження методів семантичного маскування та геометричної фільтрації. Описано архітектуру запропонованої системи, що поєднує детекцію об’єктів YOLOv8, трекінг ByteTrack, маскування динамічних областей та щільне картування на основі TSDF. Реалізовано програмний прототип, проведено експерименти на статичних та динамічних наборах даних, зокрема на послідовностях TUM RGB-D. Виконано порівняльний аналіз точності траєкторії (ATE RMSE) та візуальної якості карти у порівнянні з базовими SLAM-системами без семантичної фільтрації. Результатом дослідження є побудова та програмна реалізація нейромережевої системи Visual SLAM для динамічних середовищ; експериментальне підтвердження зменшення впливу рухомих об’єктів на якість тривимірної карти та траєкторії камери; отримання високоточних результатів на статичних послідовностях (ATE RMSE ≈ 0.0229 м) та покращення стійкості SLAM у динамічних сценах; формування рекомендацій щодо інтеграції детекторів об’єктів і трекерів у SLAM-пайплайни реального часу.Документ Відкритий доступ Iнтелектуальна система оптимiзацiї iнвестицiй та прогнозування економiчних ризикiв(КПІ ім. Ігоря Сікорського, 2025) Донченко, Iван Юрiйович; Купенко, Ольга ПетрiвнаМагiстерська дисертацiя: 90 с., 28 рис., 22 табл., 49 посилань. Об’єктом дослiдження є процеси аналiзу та прогнозування економiчних ризикiв у задачах iнвестицiйної аналiтики. Предметом дослiдження є методи, моделi та програмнi засоби iнтелектуальної системи прогнозування економiчних ризикiв на основi фiнансових показникiв пiдприємств. Метою роботи є розробка iнтелектуальної системи аналiзу економiчних ризикiв, що забезпечує прогнозування ймовiрностi настання критичних подiй та пiдтримку прийняття iнвестицiйних рiшень. У роботi оглянуто сучаснi пiдходи до оцiнювання економiчних ризикiв i методи їх прогнозування з використанням машинного навчання. Проаналiзовано та пiдготовлено набiр фiнансових даних, виконано розвiдувальний аналiз i попередню обробку даних. Розроблено та експериментально дослiджено моделi логiстичної регресiї, методу опорних векторiв, градiєнтного бустингу та нейроннi мережi типу MLP, зокрема з механiзмом уваги. Реалiзовано ансамблевi методи агрегування моделей для пiдвищення якостi прогнозування. Отримано порiвняльнi результати за показниками ROC-AUC, F1-score та Recall, вста новлено переваги ансамблевих пiдходiв для задач прогнозування ризикiв на табличних фiнансових даних. Запропоновано прототип iнтелектуальної системи, що забезпечує вве дення фiнансових показникiв пiдприємства, отримання прогнозу ризику та iнтерпретацiю ключових факторiв, якi впливають на результатДокумент Відкритий доступ Методи штучного інтелекту для задач виявлення та класифікації військових об’єктів у даних аерофотознімання(КПІ ім. Ігоря Сікорського, 2025) Дмитерчук, Віталій Олександрович; Шаповал, Наталія ВіталіївнаМагістрська дисертація: 128 с., 32 рис., 34 табл., 18 посилань, 1 додаток. Об’єкт дослідження – методи автоматизованого розпізнавання та класифікації об’єктів на зображеннях. Предмет дослідження – моделі згорткових нейронних мереж для задач розпізнавання й класифікації військових об’єктів на аерофотознімках. Мета роботи – проаналізувати існуючі моделі згорткових нейронних мереж, порівняти їхню ефективність та застосувати отриману інформацію для розробки програми, що розпізнає та класифікує військові об’єкти на аерофотознімках. Актуальність цієї дисертаційної роботи зумовлена поширенням застосування безпілотних літальних апаратів для виконання задач бойової розвідки та високим практичним потенціалом застосування методів автоматичного розпізнавання військових об’єктів на отриманих таким чином даних. Це дозволить значно прискорити процес передачі інформації щодо розташування та дій сил ворога, що в свою чергу підвищить ефективність бойової роботи всіх родів військ. У результаті виконання роботи було проаналізовано структурні компоненти згорткових нейронних мереж та види моделей, що можуть бути використані для розпізнавання й класифікації об’єктів. Навчено й протестовано дві такі моделі та реалізовано програмне забезпечення для цієї задачі.Документ Відкритий доступ SpectralCA: Hybrid Neural Network for UAV-Based Hyperspectral Landmine Detection(Igor Sikorsky Kyiv Polytechnic Institute, 2025) Brovko, Danil Vitaliiovych; Sineglazov, Viktor MykhailovychMaster's dissertation: 111 p., 29 figures, 20 tables, 41 references, and 2 appendices. The relevance of this research lies in the growing demand for unmanned aerial vehicles (UAVs) capable of operating reliably in complex environments where conventional navigation becomes unreliable due to interference, poor visibility, or camouflage. Hyperspectral imaging (HSI) provides unique opportunities for UAV-based computer vision by enabling fine-grained material recognition and object differentiation, which are critical for navigation, surveillance, agriculture, and environmental monitoring. The object of the study is hyperspectral image classification. The subject of the research is development of a high-performance deep learning architecture for a classification task in hyperspectral imaging. The purpose of this work is to modify the Mobile 3D Vision Transformer (MDvT) by introducing the proposed SpectralCA block. This block employs bi-directional cross-attention to fuse spectral and spatial features, enhancing accuracy while reducing parameters and inference time. Experimental evaluation was conducted on the WHU-Hi-HongHu dataset, with results assessed using Overall Accuracy, Average Accuracy, and the Kappa coefficient. The findings confirm that the proposed architecture improves UAV perception efficiency, enabling real-time operation for navigation, object recognition, and environmental monitoring tasks. Versions of this work were published in arXiv and presented at the 2025 IEEE 8th International Conference on Methods and Systems of Navigation and Motion Control. Also, this research won first place at the 2025 International Student Research Competition in Artificial Intelligence.Документ Відкритий доступ Адаптивні алгоритми розширення вибірок для машинного навчання згорткових нейронних мереж(КПІ ім. Ігоря Сікорського, 2025) Висоцький, Дмітрій; Литвиненко, Володимир ІвановичДипломна робота: 104 с., 19 рис., 7 табл., 14 посилань, 1 додаток. Об’єкт дослідження – процес адаптивного штучного розширення навчальних вибірок у задачах машинного навчання. Предмет дослідження – вплив методів генеративної аугментації даних, зокрема із застосуванням генеративно-змагальних мереж, на ефективність навчання згорткових нейронних мереж. Мета роботи – дослідження та розробка адаптивних алгоритмів штучного розширення вибірок для підвищення якості навчання згорткових нейронних мереж. Результати – експериментальне дослідження ефективності підходів до розширення даних з використанням генеративно-змагальних мереж, порівняльний аналіз метрик якості класифікації та формування висновків щодо оптимальних стратегій адаптивної аугментації для навчання нейронних мереж.Документ Відкритий доступ Модель акустичного виявлення БПЛА в умовах доменного зсуву та обмеженого обсягу цільових даних(КПІ ім. Ігоря Сікорського, 2025) Вільгурін, Вадим Ігорович; Джигирей, Ірина МиколаївнаМагістерська дисертація 101 с., 22 рис., 26 табл., 67 джерел. Об’єктом дослідження є акустичні сигнали безпілотних літальних апаратів (БПЛА). Предметом дослідження є методи та алгоритми класифікації аудіосигналів в умовах доменного зсуву та обмеженої кількості даних. Мета дослідження: Розробити систему акустичного виявлення БПЛА, стійку до доменного зсуву та низької кількості цільових даних. Оцінити ефективність запропонованого алгоритму на гетерогенному наборі даних, що містить записи з різних типів мікрофонів в умовах зашумленого навколишнього середовища. Новизна: запропоновано комплексний підхід, що поєднує канальну нормалізацію енергії (PCEN), міждоменну аугментацію Mixup та архітектуру ConvNeXt для вирішення проблеми детекції рідкісних класів БПЛА в умовах доменного зсуву. В даній роботі було розглянуто застосування методів адаптації домену на рівні представлення даних та аугментацій. Для підвищення стійкості моделі використано механізм уваги та аугментацій за принципом поступового ускладнення. Отримані результати свідчать про перевагу використання PCEN над Log-Mel спектрограмами в зашумлених умовах. В результаті було розроблено модель, яка досягла показника F1-score 0.734 на тестовій вибірці, ефективно виявляючи БПЛА на тлі складних акустичних перешкод.Документ Відкритий доступ Методи прунінгу для оптимізації великих мовних моделей(КПІ ім. Ігоря Сікорського, 2025) Швець, Віталій Олександрович; Шаповал, Наталія ВіталіївнаДипломна робота: 127 с., 11 рис., 25 табл., 23 посилання, 1 додаток. Об’єкт дослідження – процеси компресії великих мовних моделей. Предмет дослідження – методи прунінгу великих мовних моделей. Мета дослідження – підвищення ефективності розгортання LLM на користувацьких ресурсно-обмежених пристроях шляхом прунінгу моделей. Актуальність роботи полягає у необхідності демократизації доступу до великих мовних моделей. Сучасні моделі з мільярдами параметрів вимагають колосальних обчислювальних ресурсів, пам’яті та енергії, що обмежує їхнє розгортання на користувацьких пристроях і збільшує вартість інференсу. Прунінг є одним з ключових методів компресії, який дозволяє видаляти надлишкові параметри з мінімізацією втрати якості. Наукова новизна полягає у розробці методу прунінгу великих мовних моделей, який поєднує механізм адаптивності коефіцієнтів стиснення для різних блоків мережі разом зі структурним прунінгом в глибину та ширину. Результати дослідження можуть бути застосовані для оптимізації комерційних та відкритих LLM, роблячи їх доступнішими для широкого кола застосувань, особливо в умовах обмежених обчислювальних ресурсів. За темою дослідження була зроблена публікація у збірнику матеріалів ІV Всеукраїнської науково-практичної конференції «Системні науки та інформатика». Заплановано опублікувати статтю «Structured pruning method for large language models with adaptive compression ratios» у журналі «Artificial intelligence» у грудні 2025.Документ Відкритий доступ Гібридні підходи для моделювання та прогнозування фінансових даних(КПІ ім. Ігоря Сікорського, 2025) Харитонова, Світлана Володимирівна; Гуськова, Віра ГеннадіївнаМагістерська дисертація: 139 с., 21 рис., 16 табл., 37 посилань. Об’єкт дослідження – процеси прогнозування фінансових часових рядів на основі історичних даних торгів фондового ринку. Предмет дослідження – гібридні архітектури нейронних мереж, що поєднують методи частотної декомпозиції, статистичні методи, рекурентні й згорткові мережі, та сучасні трансформерні моделі. Мета роботи – встановлення ефективності гібридних архітектур глибокого навчання для короткострокового прогнозування фінансових часових рядів шляхом розробки та експериментальної валідації моделей, що інтегрують класичні статистичні методи, методи обробки сигналів та сучасні підходи глибокого навчання. Наукова новизна – удосконалено гібридну архітектуру на основі PatchTST шляхом інтеграції паралельної згорткової гілки та адаптивного вентильного механізму злиття ознак; розвинуто метод температурного масштабування для калібрування впевненості прогнозів; проведено комплексне порівняльне дослідження чотирьох стратегій гібридизації з встановленням залежності ефективності від волатильності активу та ринкових умов. Практичне значення – розроблені моделі можуть безпосередньо застосовуватися для побудови алгоритмічних торгових стратегій, систем підтримки прийняття інвестиційних рішень та інструментів управління ризиками.Документ Відкритий доступ Прунінг згорткових нейронних мереж за допомогою інтерпретованості мереж Колмогорова-Арнольда(КПІ ім. Ігоря Сікорського, 2025) Єфанов, Ілля Сергійович; Шаповал, Наталія ВіталіївнаДипломна робота – 140 с., 17 табл., 2 рис., додаток, 35 джерел. Тема: Прунінг згорткових нейронних мереж за допомогою інтерпретованості мереж Колмогорова-Арнольда. У роботі розглянуто проблему надмірної параметризації сучасних глибоких нейронних мереж та проаналізовано існуючі методи їх стиснення, зокрема прунінг та дистиляцію знань. Запропоновано новий підхід до структурного прунінгу, що базується на використанні інтерпретованості мереж Колмогорова-Арнольда (KAN). Об’єкт дослідження: процес оптимізації згорткових нейронних мереж шляхом структурного прунінгу. Предмет дослідження: метод KAN-керованого структурного прунінгу, заснований на аналізі функціональної важливості компонентів мережі. Мета роботи: розробка та дослідження методу структурного прунінгу CNN, який використовує аналіз важливості ознак, отриманий з інтерпретованого KAN-шару («bottleneck»), для зменшення обчислювальної складності моделі при збереженні точності. В ході виконання роботи досліджено математичні основи KAN та теорію B-сплайнів. Розроблено гібридну архітектуру CNN-KAN та алгоритм ітеративного прунінгу, де критерій видалення фільтрів базується на аналізі коефіцієнтів сплайнів функцій активації. Програмна реалізація виконана мовою Python з використанням бібліотек PyTorch та efficient-kan. Ефективність методу перевірено на наборі даних CIFAR-10, продемонстровано переваги семантично обґрунтованого прунінгу над класичними евристичними підходами.Документ Відкритий доступ Деформовані згорткові мережі(КПІ ім. Ігоря Сікорського, 2025) Орленко, Антон Сергійович; Чумаченко, Олена ІллівнаМагістерська дисертація: 121 с., 18 рис., 20 табл., 18 посилань, додаток. Об’єкт дослідження – процеси автоматизованої сегментації та класифікації сміття у системах комп’ютерного зору для задач переробки відходів. Предмет дослідження – методи, моделі та програмні засоби застосування деформованих згорткових мереж і деформованого RoI-пулінгу для підвищення стійкості розпізнавання відходів у складних умовах. Мета роботи – розробити та експериментально перевірити підхід структурно-параметричного синтезу моделі на основі деформованих згорток для задач сегментації/класифікації сміття. У роботі розглянуто процеси переробки відходів і світовий досвід автоматизованого сортування. Проаналізовано підходи комп’ютерного зору для класифікації, детекції та сегментації сміття й обґрунтовано доцільність використання деформованих згорткових мереж для сцен із високою геометричною варіативністю. Описано принципи DCN, деформованої вибірки та деформованого RoI пулінгу. Було створено програмне забезпечення для навчання розробленої моделі, для чого було обрано датасет ZeroWaste, реалізовано програмні компоненти для навчання та оцінювання моделі. Проведено експерименти з підбором гіперпараметрів і проаналізовано якість навчання. За результатами випробувань отримано високу якість розпізнавання, визначено класи з найкращими показниками та окреслено шляхи покращення для складніших категорій через розширення й балансування даних. Результати роботи також було представлено на всеукраїнській науково-практичній конференції.Документ Відкритий доступ Синтез та архітектурна адаптація дифузійних конвеєрів для аудіо-керованої анімації портретів(КПІ ім. Ігоря Сікорського, 2025) Мазур, Маркіян-Юліан Мирославович; Шаповал, Наталія ВіталіївнаМагістерська дисертація: 111 сторінок, 22 рисунки, 23 таблиці, 34 джерела. Актуальність теми. Розвиток цифрових індустрій потребує фотореалістичних аватарів. Існуючі методи синтезу мовлення (наприклад, Wav2Lip або NeRF) мають суттєві недоліки: низька якість, ефект «зловісної долини» або надмірні вимоги до обчислювальних ресурсів. Актуальним є створення енергоефективної системи високоякісного ліпсінку, що працює в реальному часі. Зв’язок роботи з науковими програмами. Робота виконана згідно з планом науково-дослідних робіт кафедри за напрямком розвитку систем штучного інтелекту. Мета дослідження – підвищення якості та стабільності візуального мовлення шляхом розробки каскадної нейромережевої системи з використанням механізму RAG. Об’єкт дослідження – процес автоматичної генерації відеопослідовності мовлення за вхідним аудіосигналом. Предмет дослідження – методи глибокого навчання для синтезу 3D-геометрії та нейронного рендерингу з використанням Retrieval-Augmented Generation. Методи дослідження: цифрова обробка сигналів (HuBERT); комп’ютерний зір (MediaPipe); глибоке навчання (LSTM, GAN); векторний пошук (FAISS). Наукова новизна: 1. Вперше застосовано RAG для передбачення 3D-лендмарків, що усунуло ефект часового тремтіння. 2. Удосконалено метод мультимодальної фузії через механізм Cross-Attention. 3. Набув подальшого розвитку метод нейронного рендерингу, оптимізований для мобільних GPU. Практичне значення. Створено ПЗ «RuzamSync», що генерує ліпсінк (LSE-D 5.50) на RTX 3050 Ti зі швидкістю 17 FPS. Розроблено стартап-проєкт. Апробація та публікації. Основні положення доповідалися на конференції, опубліковано 1 статтю.Документ Відкритий доступ Інтелектуальна система обробки гіперспектральних зображень з використанням покращеного механізму злиття ознак та блоків самоуваги(КПІ ім. Ігоря Сікорського, 2025) Катькало, Денис Русланович; Синєглазов, Віктор МихайловичМагістерська дисертація: 206 с., 5 рис., 17 табл., 79 посилань, додаток. Об’єкт дослідження – процес класифікації гіперспектральних зображень методами глибинного навчання. Предмет дослідження – методи відбору інформативних спектральних каналів, міжпотокового злиття ознак та адаптивного інференсу в двопотокових нейронних архітектурах. Мета роботи – підвищення точності та практичної придатності класифікації гіперспектральних зображень шляхом модифікації архітектури DSSFN на основі відбору каналів E-FDPC, введення проміжної перехресної уваги та використання адаптивного інференсу. Методи дослідження: аналіз наукових джерел; методи глибокого навчання (згорткові нейронні мережі); кластеризація (E-FDPC) для зменшення розмірності даних; механізми самоуваги та перехресної уваги; адаптивні обчислення (Adaptive Computation Time) для динамічного керування глибиною мережі; багатокритеріальна оптимізація (NSGA-II). Результати роботи. Розроблено архітектуру Adaptive DSSFN. Інтегровано метод E-FDPC для автоматичного відбору каналів та модуль двонаправленої перехресної уваги (BCA) для покращення взаємодії потоків. Реалізовано механізм ACT для динамічного керування глибиною мережі. Експериментально досягнуто приріст точності (OA) на 17,6% в умовах дефіциту даних (Indian Pines, 5% навчання) та зниження обчислювальної складності (FLOPs) у 2,9 рази на простих сценах (Pavia University). Розроблено стартап-проєкт «SpectraSense» для систем БПЛА.