Спосіб компресії великих мовних моделей

Кравець, Павло Андрійович

Спосіб компресії великих мовних моделей

Файли

Kravets_magistr.pdf (1.79 MB)

Дата

2023

Автори

Кравець, Павло Андрійович

Науковий керівник

Волокита, Артем Миколайович

Видавець

КПІ ім. Ігоря Сікорського

Анотація

В магістерській дисертації запропоновано спосіб компресії великих мовних моделей BERT-подібної архітектури, що заснований на комбінації дистилювання на логітах та скорочення голів уваги, та досліджені його властивості. Програма дозволяє отримати й оцінити результати компресії моделі з високою гранулярністю для порівняння ефективності роботи алгоритму у відношенні із аналогами. Програмний продукт був створений на мові Python.

Ключові слова

нейронна мережа, neural network, трансформер, transformer, BERT, компресія, compression, скорочення голів уваги, attention head pruning, дистиляція знання, knowledge distillation

Бібліографічний опис

Кравець, П. А. Спосіб компресії великих мовних моделей : магістерська дис. : 121 Інженерія програмного забезпечення / Кравець Павло Андрійович. – Київ, 2023. – 84 с.

URI

https://ela.kpi.ua/handle/123456789/64530

Зібрання

Магістерські роботи (ОТ)
Магістерські роботи

Повна інформація про документ

Спосіб компресії великих мовних моделей

Файли

Дата

Автори

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Опис

Ключові слова

Бібліографічний опис

ORCID

URI

DOI

Зібрання