Класифікація текстових повідомлень на основі обмежених наборів даних за допомогою мультимовних моделей глибинного навчання

Вантажиться...
Ескіз

Дата

2023-05

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Пояснювальна записка магістерської дисертації складається з чотирьох розділів, містить 54 рисунка, 2 таблиці, 2 додатки та 29 джерел. Об`єкт дослідження: процес виявлення булінгу в україномовних текстах при відсутності достатньої кількості навчальних прикладів природною українською мовою. Мета дипломного проекту: підвищення ефективності текстової класифікації в умовах обмежених наборів даних за рахунок: застосування методів аугментації навчальних даних, використання мультимовниз моделей без навчання, створення гібридних моделей на основі мультимовних моделей з донавчанням на реальних даних. Практична цінність розробленої моделі полягає в тому, що доведена ефективність використання машинного перекладу для доповнення навчального і валідаційного наборів даних та запропонована двохетапна модель вирішення задач класифікації текстових даних для мов з обмеженими ресурсами на основі донавчання мультимовних моделей на доповнених наборах навчальних даних.

Опис

Ключові слова

мультимовні моделі, класифікація без навчання, виявлення булінгу, мультимовні моделі, програмний застосунок

Бібліографічний опис

Матвійчук, І. А. Класифікація текстових повідомлень на основі обмежених наборів даних за допомогою мультимовних моделей глибинного навчання : магістерська дис. : 126 Інформаційні системи та технології / Матвійчук Ірина Анатоліївна. – Київ, 2023. – 104 с.

DOI