Дослідження масштабованості архітектури сходових нейронних мереж для високонавантажених задач обробки великих наборів даних
Вантажиться...
Дата
2024
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Магістерська дисертація: 116 сторінки, 15 таблиці, 18 рисунків, додаток, 21
посилання.
Мета дослідження — підвищити швидкодію архітектури сходових
нейронних мереж шляхом застосування методів підвищення масштабованості.
Об’єкт дослідження — сходові нейронні мережі.
Предмет дослідження — методи підвищення масштабованості сходових
нейронних мереж в високонавантажених задачах.
Методи дослідження — квантизація після навчання та навчання з
урахуванням квантизації в цільночислені представлення чисел та
представлення з плаваючою комою на процесорі та відеоприскорювачі CUDA.
Розглянуто проблеми масштабованості cходових нейронних мереж для
високонавантажених задач машинного навчання. Досліджено методи
квантизації вагів сходових нейронних мереж до різної точності представлення
чисел на процесорі та прискорювачі CUDA. Проведено експерименти щодо їх
впливу на точність прогнозування, швидкодію обробки даних, та розмір
результуючого файлу моделі. Проаналізовано та порівняно результати різних
методів квантизації та її відсутності на ефективність використання сходових
нейронних мереж до задач обробки даних.
Результати роботи можуть бути використані для підвищення
масштабованості та швидкодії сходових нейронних мереж в
високонавантажених задачах, де їх застосування цієї архітектури є доцільним,
наприклад, обробка відео та аудіосигналу, задачі обробки зображень та інші.
Опис
Ключові слова
cходова нейронна мережа, масштабованість, квантизація, напівкероване навчання, машинне навчання, штучний інтелект, ladder neural network, scalability, quantization, semi-supervised learning, machine learning, artificial intelligence
Бібліографічний опис
Єрко, А. В. Дослідження масштабованості архітектури сходових нейронних мереж для високонавантажених задач обробки великих наборів даних : магістерська дис. : 122 Комп'ютерні науки / Єрко Андрій Вадимович. - Київ, 2024. - 116 с.