Програмне та алгоритмічне забезпечення для структурно-параметричного синтезу нейронних мереж на коротких вибірках
Вантажиться...
Дата
2022-06
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Розмір пояснювальної записки – 107 аркушів, містить 26 ілюстрацій, 10 таблиць, 2 додатки, 1 плакат.
Актуальність теми. На сьогоднішній день, штучні нейронні мережі глибокого навчання є провідними моделями для вирішення широкого спектру задач. До даних задач відносяться інтелектуальна обробка зображень та відео (комп’ютерний зір), обробка аудіо, природної мови і багато інших. На жаль, багато сучасних задач машинного навчання не мають достатньої кількості навчальних даних через складність їх збору (наприклад, задачі в медицині). Саме для таких випадків застосовується підхід transfer learning (передавальне навчання), суть якого полягає у застосуванні для вирішення завдання моделі, яка вже була навчена на даних для іншої (але дещо подібної) задачі. Отже, актуальність роботи полягає у вивченні підходу transfer learning та створенні алгоритму для синтезу нейронних мереж глибокого навчання на базі даного підходу задля збільшення ефективності використання нейронних мереж глибокого навчання в задачах з обмеженою кількістю даних.
Мета дослідження. Основною метою є підвищення ефективності нейронних мереж глибокого навчання для вирішення прикладних задач із невеликою навчальною вибіркою.
Об’єкт дослідження: transfer learning в задачах глибокого навчання, структурно-параметричний синтез нейронних мереж глибокого навчання на основі застосування transfer learning, підходи в побудові архітектури та інфраструктури програмного забезпечення.
Предмет дослідження: програмне та алгоритмічне забезпечення для автоматизації підбору архітектури та налаштуванню глибоких нейронних мереж для задач з невеликою навчальною вибіркою.
Для реалізації поставленої мети сформульовані наступні завдання:
— проаналізувати існуючі рішення для програмного забезпечення з можливістю синтезу нейронних мереж під цільові задачі;
— дослідити поняття, принципи та існуючі підходи структурно-параметричного синтезу глибоких нейронних мереж та передавального навчання (transfer learning), особливостей їх застосування;
— на основі виконаних досліджень виконати математичну постановку задачі та проєктування алгоритмічного забезпечення системи;
— виконати проєктування архітектури програмної системи, обрати інструменти реалізації та імплементувати систем;
— проаналізувати результати роботи системи, виконати оцінку ефективності отриманих моделей на задачах обробки зображень (зокрема, класифікації зображень).
Наукова новизна результатів магістерської дисертації полягає в тому, що запропоновано власне алгоритмічне забезпечення для структурно-параметричного синтезу нейронних мереж глибокого навчання для задач з обмеженою кількістю навчальних даних, який збільшує ефективність застосування даних моделей для розв’язання задач машинного навчання. Дане алгоритмічне забезпечення відрізняється від відомих підходів наявністю етапу оцінки найбільш підходящої вихідної вибірки, використанням багатокритеріального алгоритму для структурно-параметричної оптимізації шарів класифікатора згорткових нейронних мереж.
Практичне значення отриманих результатів полягає в тому, що розроблене програмне забезпечення може бути застосованим у сферах людської діяльності, в яких збір великого масиву навчальних даних є складною задачею. Зокрема, алгоритмічне забезпечення роботи використовується для задачі діагностування ступеню активності туберкульозного процесу, яка виконується спільно з державною установою «Національний інститут фтизіатрії та пульмонології ім. Ф.Г. Яновського НАМН України»
Зв’язок з науковими програмами, планами, темами. Робота виконувалась на кафедрі інформатики та програмної інженерії Національного технічного університету України "Київський політехнічний інститут імені Ігоря Сікорського".
Апробація. Проєкт за даною дисертацією став фіналістом конкурсу Sikorsky Challenge (2020) (доступ: https://startups-2020.sikorskychallenge.com/2020/10/174.html).
Публікації. Наукові положення дисертації пройшли апробацію в наступних публікаціях:
1. Sineglazov V., Riazanovskiy K., Klanovets A., Chumachenko O., Linnik. N., “Intelligent tuberculosis activity assessment system based on an ensemble of neural networks”, Computers in Biology and Medicine, Elsevier, 2022 (прийнято до публікації).
2. Sineglazov V., Riazanovskiy K., Klanovets A., “Multi-criteria optimization of software architectures selection for CADx systems”, Journal of Healthcare Informatics Research, Springer, 2022 (здано до редакції).
Опис
Ключові слова
transfer learning, глибоке навчання, багатокритеріальна оптимізація, deep learning, multiobjective optimization
Бібліографічний опис
Клановець, О. В. Програмне та алгоритмічне забезпечення для структурно-параметричного синтезу нейронних мереж на коротких вибірках : магістерська дис. : 121 Інженерія програмного забезпечення / Клановець Олександр Володимирович. – Київ, 2022. – 107 с.