Дисертації (ОТ)
Постійне посилання зібрання
У зібранні розміщено дисертації, які захищені працівниками кафедри.
Переглянути
Перегляд Дисертації (ОТ) за Автор "Гордієнко, Юрій Григорович"
Зараз показуємо 1 - 3 з 3
Результатів на сторінці
Налаштування сортування
Документ Відкритий доступ Метод адаптації глибоких нейронних мереж до апаратного забезпечення зі спеціалізованою архітектурою(КПІ ім. Ігоря Сікорського, 2022) Таран, Владислав Ігорович; Гордієнко, Юрій ГригоровичДокумент Відкритий доступ Метод сегментації зображень з використанням глибоких нейронних мереж(КПІ ім. Ігоря Сікорського, 2024) Статкевич, Роман Вадимович; Гордієнко, Юрій ГригоровичСтаткевич Р.В. Метод сегментації зображень з використанням глибоких нейронних мереж. – Кваліфікаційна наукова робота на правах рукопису Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 121 – Інженерія програмного забезпечення з галузі знань 12 – Інформаційні технології. – Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського», Київ, 2024. Дисертаційна робота присвячена розробці та удосконаленню нейронних мереж для семантичної сегментації зображень, що базуються на архітектурі U-Net, та дозволяє покращити результати та метрики передбачень, у порівнянні з базовою архітектурою. Аналіз зображень у контексті семантичної сегментації є однією з актуальних задач, що широко використовуються у різних галузях, таких як аналіз та діагностика медичних зображень, автономні автомобілі, тощо. Покращення методів семантичної сегментації дозволяє краще виявляти патології у людському організмі, а для систем управління автомобілем – краще розуміти навколишнє середовища та краще реагувати на виникнення небезпечних ситуацій у процесі дорожнього руху. Саме тому важливо постійно удосконалювати уже наявні методи. Тема дисертаційної роботи входить в план наукової роботи затвердженому на кафедрі обчислювальної техніки КПІ ім. Ігоря Сікорського, що враховує розпорядження Кабінету Міністрів України від 2 грудня 2020 р. № 1556-р про схвалення Концепції розвитку штучного інтелекту в Україні. Метою дисертації було покращення існуючих засобів аналізу зображень в контексті задач сегментації зображень, що дозволять отримувати більш точні результати. Для досягнення цієї мети, було поставлено та вирішено наступні завдання: - Проведено огляд та описано особливості основних архітектур нейронних мереж для аналізу зображень в контектсі задач класифікації та сегментації; - У деталях розглянуто сімейство нейронних мереж U-Net; - Запропоновано та обґрунтовано методи модифікації архітектур U-Net з використанням способу підбору коефіцієнта розширення та способу глибинних роздільних проміжних зв’язків. - Проведено велику кількість експериментів на різних наборах даних, з використанням різних підходів та запропонованих нововведень і К-кратної перехресної перевірки для підтвердження якісних покращень результатів. - Проведено виміри впливу запропонованого методу модифікації нейронної мережі U-Net на метрики швидкодії та пам’яті Запропоновано спосіб підбору коефіцієнту розширення архітектури U-Net, що дозволяє регулювати глибину нейронної мережі та збільшення (чи зменшення) кількості параметрів даної архітектури. Завдяки цьому з’явилася можливість оптимізувати розмір нейронної мережі, та отримати результати, співставні з результатами базової архітектури, при 2.5 меншій кількості параметрів нейронної мережі. Також було запропоновано спосіб глибинних роздільних проміжних зв’язків архітектури U-Net, що базується на основі глибинних роздільних згорткових шарів. Дана модифікація дозволила покращити точність сегментації при незначному збільшенні кількості параметрів. Разом з цим, ці модифікації дозволяють також покращувати результати не лише базової архітектури U-Net, але і її модифіковані версії, що було показано на прикладі Attention-UNet. Для різних наборів даних, було виявлено щонайменше один з варіантів модулів глибинних роздільних проміжних зв’язків, що дозволив покращити точність сегментації від 1% до 5%. У деяких випадках дане покращення було досягнуте за рахунок збільшення архітектури лише на 1%, що підтверджує якісні властивості даних змін. На основі запропонованих способів, було розроблено метод модифікації нейронних мереж U-Net для задач сегментації зображень, з використанням мови програмування Python та бібліотеки Tensorflow для експериментального підтвердження доцільності даних модифікацій. Експерименти було проведено у різних доменах знань, таких як аналіз медичних зображень, а також аналіз міського середовища. Також, запропоновані підходи були перевірені як на двовимірних зображеннях, так і тривимірних об’ємах, що підтверджує практичність застосування запропонованих у роботі способів модифікації нейронних мереж. Для експериментів використовувалися відомі набори даних, такі як UWGIT, BraTS, CityScapes, Synapse. Було також продемонстровано, що запропоновані модифікації дозволяють досягнути, а в деяких випадках, перевершити точність деяких відомих та широковживаних архітектур нейронних мереж. Окрім того, було проведено аналіз швидкодії та використання пам’яті для запропонованих модифікацій нейронних мереж. Було встановлено, що глибші мережі, які використовують підхід з коефіцієнтом розширення, можуть працювати швидше, аніж базова архітектура, при приблизно однаковій точності сегментації. Розроблений метод має велике практичне значення та широке поле для застосування у галузі аналізу зображень, що було експериментально підтверджено у ході досліджень.Документ Відкритий доступ Метод та програмні засоби мультимодального аналізу медичних даних на основі глибокого навчання(КПІ ім. Ігоря Сікорського, 2023) Шульга, Максим Володимирович; Гордієнко, Юрій ГригоровичШульга М.В. Метод та програмні засоби мультимодального аналізу медичних даних на основі глибокого навчання. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 121 – Інженерія програмного забезпечення з галузі знань 12 – Інформаційні технології. – Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського», Київ, 2023. Дисертаційна робота присвячена розробці методу та програмних засобів мультимодального аналізу медичних даних на основі глибокого навчання, що дозволяє підвищити точність багатокласової класифікації. Останнім часом сфера медицини активно використовує можливості штучного інтелекту. Зокрема, глибокі нейронні мережі довели свою ефективність і придатність для автоматизованого виявлення та класифікації захворювань. Інтеграція методів штучного інтелекту має потенціал для оптимізації та покращення точності програм скринінгу шляхом автоматизації аналізу медичних даних, усуваючи необхідність безпосередньої участі медичного персоналу на етапі скринінгу. Нагальною проблемою в цьому контексті є діагностика діабетичної ретинопатії, поширеного ускладнення діабету, що призводить до погіршення зору серед дорослого населення світу. Отже, в даний час існує актуальна потреба в застосуванні підходу з використанням комп’ютерного зору та глибоких нейронних мереж для надання передових медичних послуг за допомогою штучного інтелекту, з особливим акцентом на класифікації діабетичної ретинопатії. Тема дисертаційної роботи входить в план наукової роботи затвердженому на кафедрі обчислювальної техніки КПІ ім. Ігоря Сікорського, що враховує розпорядження Кабінету Міністрів України від 2 грудня 2020 р. № 1556-р про схвалення Концепції розвитку штучного інтелекту в Україні. Метою дисертаційної роботи є підвищення точності багатокласової класифікації захворювань глибокими нейронними мережами, шляхом розробки методу мультимодального аналізу медичних даних. Об’єктом дослідження є процеси аналізу вимог, розробки, впровадження і супроводження програмного забезпечення для мультимодального аналізу медичних даних на основі глибокого навчання, які сприяють підвищенню точності визначення окремих класів для завдання багатокласової класифікації медичних даних; а предметом дослідження – методи і моделі розробки і супроводу програмного забезпечення для мультимодального аналізу медичних даних на основі глибоких нейронних мереж різної архітектури і способів організації додаткових модальностей. Методичною основою дослідження є системне опрацювання та аналіз теоретичного матеріалу, присвяченого підвищенню точності вирішення завдання багатокласової класифікації, шляхом аналізу медичних даних за допомогою моделей глибоких нейронних мереж. Для досягнення поставленої мети були вирішені такі завдання: - було досліджено сучасні методи та системи виявлення та багатокласової класифікації захворювань на прикладі діабетичної ретинопатії; - було виявлено шляхи покращення існуючих методів та систем виявлення та багатокласової класифікації захворювань на прикладі діабетичної ретинопатії; - було розроблено метод мультимодального аналізу медичних даних на основі доповнення метаданих; - було розвинуто спосіб підвищення точності багатокласової класифікації завдяки використанню методу мультимодального аналізу для різних архітектур згорткової компоненти нейронної мережі; - було розроблено метод недетермінованого штучного доповнення метаданих; - було розвинуто спосіб підвищення точності багатокласової класифікації завдяки використанню методу недетермінованого штучного доповнення метаданих для різних стандартних і спеціалізованих медичних наборів даних; - було розроблено математичний опис для оцінки підвищення точності багатокласової класифікації на різних стандартних і спеціалізованих медичних наборах даних. За результатами проведеного дослідження та згідно поставленого завдання було запропоновано комплексний метод мультимодального аналізу медичних даних на основі глибокого навчання, при розробці якого були проведені наступні дослідження: - дослідження доповнення метаданих для вирішення завдання багатокласової класифікації; - дослідження впливу складності мультимодальної моделі на вирішення завдання багатокласової класифікації; - дослідження недетермінованого доповнення метаданих для вирішення завдання багатокласової класифікації; - дослідження впливу мультимодального доповнення метаданих на точність багатокласової класифікації. Розглянуто проблему багатокласової класифікації для одномодальної (з введенням зображення) моделі та мультимодальної (з введенням зображення та тексту) моделі та створено кілька варіантів вхідних значень і відповідних моделей на основі аналізу способів та методів використання глибокого навчання для виявлення захворювань на прикладі діабетичної ретинопатії і аналізу існуючих методологій виявлення захворювань: одномодальна модель (SM) лише з вхідним зображенням і мультимодальні моделі з вхідними зображеннями та текстом, як-от мультимодальна модель із думкою пацієнта (MP), мультимодальна модель із думкою експерта (ME), мультимодальна модель із думкою пацієнта та експерта (MPE) та мультимодальна модель з недетермінованою думкою експерта (MMFE). Вплив додаткових даних, таких як суб'єктивна думка “пацієнта” про свій стан здоров'я та думка “експерта” (що забезпечує “витік даних”), може бути корисним у деяких практичних ситуаціях. Думки пацієнтів та експертів були імітовані додатковими (доповненими) даними, отриманими з змодельованих анкет. Проведено дослідження доповнення метаданих для вирішення завдання багатокласової класифікації, яке показало, що всі створені мультимодальні моделі (MP, ME, MPE) у порівнянні з одномодальною моделлю (SM) дозволили досягти різних статистично значущих покращень точності багатокласової класифікації за значенням площі під кривою похибок (AUC) для всіх класів у діапазоні від 4% до 27%, що виходять за межі стандартного відхилення 2-3% виміряного перехресною перевіркою. Проведено дослідження дослідження впливу складності мультимодальної моделі на вирішення завдання багатокласової класифікації, яке показало, що мультимодальна модель (MP) у порівнянні з одномодальною моделлю (SM) дозволила досягти різних статистично значущих покращень точності багатокласової класифікації за значенням AUC для деяких класів у діапазоні від 15% до 26% (в залежності від складності архітектури згорткової компоненти нейронної мережі), що виходять за межі стандартного відхилення 3-8% виміряного перехресною перевіркою. Проведено дослідження недетермінованого доповнення метаданих для вирішення завдання багатокласової класифікації, яке показало, що мультимодальна модель (MMFE) у порівнянні з одномодальною моделлю (SM) дозволила досягти різних статистично значущих покращень точності багатокласової класифікації за значенням AUC у діапазоні від 12% до 26%. Наведено теоретичні оцінки можливих (найкращих – коли точність за класами підвищується на сумарну похибку точності за окремими класами для одномодальної моделі, де похибку вдається зменшити завдяки застосуванню маркування у додатковій модальності; проміжних – коли точність за класами підвищується на сумарну похибку точності, помножену на функцію розподілу ймовірностей, де продемонстровано можливу залежність покращення від середньої точності для одномодальної моделі; і найгірших – коли точність за класами не підвищується взагалі) рівнів покращення точності багатокласової класифікації за допомогою простого математичного опису з акцентом на деяких практичних випадках. На основі теоретичних оцінок проведено дослідження впливу мультимодального доповнення метаданих на точність багатокласової класифікації з використанням різних стандартних (CIFAR10) і спеціалізованих медичних (PathMNIST, RetinaMNIST) наборів даних, яке показало, що точність мультимодальних моделей значно змінюється залежно від складності набору даних, розміру вибірки та мінливості даних. Запропоновано комплексний метод мультимодального аналізу медичних даних на основі глибокого навчання, який полягає у використанні “витоку даних” на крайніх і подібних класах, що дозволяє підвищити точність визначення окремих класів для вирішення завдань багатокласової класифікації. Проведено аналіз результатів використання запропонованого комплексного методу мультимодального аналізу медичних даних, який показав, що запропонований метод на відміну від існуючих рішень за рахунок використання додаткових модальностей на основі доповнення метаданих дозволив отримати підвищення точності визначення окремих класів для завдань багатокласової класифікації захворювань на 4-27% у порівняння зі стандартним одномодальним підходом для розглянутих ідентичних наборів даних і архітектур нейронних мереж.