Метод гібридизації класичних та некласичних обчислень для завдань штучного інтелекту
Вантажиться...
Дата
2025
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Трочун Є.В. Метод гібридизації класичних та некласичних обчислень для завдань штучного інтелекту. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 121 – Інженерія програмного забезпечення з галузі знань 12 – Інформаційні технології. – Національний Технічний Університет України «Київський Політехнічний Інститут імені Ігоря Сікорського», Київ, 2025.
Дисертаційна робота присвячена розробці комплексного методу гібридизації класичних та квантових обчислень для підвищення продуктивності та ефективності роботи систем штучного інтелекту, які будуються на основі глибоких нейронних мереж. Вперше було розроблено комплексний метод підвищення ефективності роботи глибоких нейронних мереж за допомогою використання квантових обчислень. Досліджено метод використання квантового пристрою у вигляді одного з прихованих рівнів гібридної глибокої нейронної мережі для підвищення швидкодії моделі штучного інтелекту. Підвищення швидкодії досягається за рахунок інкапсуляції частини обчислень у квантовий пристрій, що виконується на квантовому апаратному забезпеченні, яке надає значне прискорення виконання обчислень порівняно з класичним апаратним забезпеченням. Це робить класичну частину гібридної моделі менш глибокою та відповідно зменшує кількість класичних операцій, що необхідна для роботи нейронної мережі, що відповідно збільшує швидкодію моделі. Розроблено метод використання квантового пристрою для попередньої обробки вхідних даних для збільшення варіативності тренувального набору даних та підвищення точності роботи моделі за рахунок залучення більш різноманітних даних для тренування моделі. Відповідно до методу, квантовий пристрій використовується для квантового «зашумлення» тренувальних данихта виконує роль кроку штучного розширення тренувального набору даних (data augmentation, або ж скорочено DA) при підготовці моделі. Це дозволяє розширити тренувальний набір даних та відповідно досягнути вищих показників точності порівняно з референтними моделями, особливо у контексті задач, де тренувальний набір даних є обмеженим. Розроблено метод використання квантової схеми у якості першого згорткового шару глибоких згорткових нейронних мереж для підвищення точності роботи моделі штучного інтелекту. Відповідно до розробленого методу, квантовий згортковий шар створює багатоканальне представлення вхідного зображення та модель використовує глибоку згорткову мережу у якості класичної частини гібридної моделі для опрацювання багатоканального варіанту зображення, що сприяє кращому виділенню характерних рис класів та сприяє підвищенню точності роботи моделі. Розроблено набір програмних компонентів для виконання як класичних задач класифікації зображень, що використовуються для аналізу ефективності моделей штучного інтелекту, так і показано ефективність підходів для вирішення практико-орієнтованої задачі аналізу знімків місцевості, отриманих з супутника, для виявлення ділянок уражених природною катастрофою. Для експериментів було використано гібридні моделі, побудовані на основі глибоких згорткових нейронних мереж, як простої пірамідальної архітектури, так і складніші та більш сучасні рішення, такі як ResNet50 та EfficientNet. Проведено аналіз результатів застосування запропонованих методів гібридизації класичних та некласичних обчислень. За результатами експериментів з застосуванням запропонованих методів, було продемонстровано їх ефективність у контексті підвищення точності роботи моделей з простішими архітектурами (згорткові нейронні мережі пірамідальної архітектури) на класичних та достатньо повних наборах даних, таких як CIFAR100 (покращення точності класифікації на 2.9% порівняно з референтною моделлю VGG-16). На практико-орієнтованій задачі класифікації зображень, представленої набором даних супутникових знімків, який є менш повним, збільшення ефективності було продемонстровано гібридними моделями наоснові як простіших, так і складних архітектур (таких як EfficientNet та ResNet50). Та було досягнуто нової найсучаснішої та найвищої «state-of-the-art» (SOTA) точності 98.81% (покращення на 0.31% порівняно з референтною моделлю) за допомогою гібридної квантово-класичної моделі, побудованої на основі EfficientNet. Також було доведено можливість та практичність використання методу гібридизації, що полягає у виокремленні частини прихованих шарів глибокої нейронної мережі у квантовий пристрій. Даний підхід гібридизації показав нижчу точність роботи моделі, досягнувши точності у 72.75% (зниження точності на 3.25% відносно референтної моделі) на наборі даних супутникових знімків. Проте це зниження точності може бути несуттєвим у ряді задач відносно пришвидшення операцій за рахунок перенесення частини обчислень на квантове апаратне забезпечення. Розроблені методи є складовими комплексного методу гібридизації класичних та некласичних обчислень та дозволяють підготувати гібридні моделі на основі класичних нейронних мереж, залежно від типу задачі та вимог з підвищення швидкодії чи точності роботи моделей при вирішенні ряду різноманітних практичних задач.
Опис
Ключові слова
гібридні нейронні мережі, квантові обчислення, глибокі нейроні мережі, машинне навчання, класифікація зображень, hybrid neural networks, quantum computing, deep neural networks, machine learning, image classification
Бібліографічний опис
Трочун, Є. В. Метод гібридизації класичних та некласичних обчислень для завдань штучного інтелекту : дис. … д-ра філософії : 121 Інженерія програмного забезпечення / Трочун Євгеній Володимирович. – Київ, 2025. – 151 с.