Дослідження масштабованості архітектури сходових нейронних мереж для високонавантажених задач обробки великих наборів даних

Вантажиться...
Ескіз

Дата

2024

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Магістерська дисертація: 116 сторінки, 15 таблиці, 18 рисунків, додаток, 21 посилання. Мета дослідження — підвищити швидкодію архітектури сходових нейронних мереж шляхом застосування методів підвищення масштабованості. Об’єкт дослідження — сходові нейронні мережі. Предмет дослідження — методи підвищення масштабованості сходових нейронних мереж в високонавантажених задачах. Методи дослідження — квантизація після навчання та навчання з урахуванням квантизації в цільночислені представлення чисел та представлення з плаваючою комою на процесорі та відеоприскорювачі CUDA. Розглянуто проблеми масштабованості cходових нейронних мереж для високонавантажених задач машинного навчання. Досліджено методи квантизації вагів сходових нейронних мереж до різної точності представлення чисел на процесорі та прискорювачі CUDA. Проведено експерименти щодо їх впливу на точність прогнозування, швидкодію обробки даних, та розмір результуючого файлу моделі. Проаналізовано та порівняно результати різних методів квантизації та її відсутності на ефективність використання сходових нейронних мереж до задач обробки даних. Результати роботи можуть бути використані для підвищення масштабованості та швидкодії сходових нейронних мереж в високонавантажених задачах, де їх застосування цієї архітектури є доцільним, наприклад, обробка відео та аудіосигналу, задачі обробки зображень та інші.

Опис

Ключові слова

cходова нейронна мережа, масштабованість, квантизація, напівкероване навчання, машинне навчання, штучний інтелект, ladder neural network, scalability, quantization, semi-supervised learning, machine learning, artificial intelligence

Бібліографічний опис

Єрко, А. В. Дослідження масштабованості архітектури сходових нейронних мереж для високонавантажених задач обробки великих наборів даних : магістерська дис. : 122 Комп'ютерні науки / Єрко Андрій Вадимович. - Київ, 2024. - 116 с.

DOI