Великі мовні моделі з використанням LoRA для одночасної подвійної класифікації тексту
dc.contributor.advisor | Кузнєцова, Наталія Володимирівна | |
dc.contributor.author | Северин, Олександр Владиславович | |
dc.date.accessioned | 2024-09-19T08:47:03Z | |
dc.date.available | 2024-09-19T08:47:03Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Дипломна робота містить 137 сторінок, 7 рисунків, 11 таблиць, 2 додатки, 36 джерел посилання. Об‘єкт дослідження – дописи у соціальних мережах. Мета дослідження – побудувати класифікаційну модель, що здатна класифікувати текст для двох окремих задач одночасно; створити примітивну систему моніторингу суспільних настроїв у соціальних мережах. Актуальність дослідження – застосування великих мовних моделей для багатовимірних одночасних класифікаційних задач – оцінки настроїв суспільства. Методи дослідження – великі мовні моделі, Low-Rank Adaptation, Weight- Decomposed Low-Rank Adaptation, Rank Stabilized Low-Rank Adaptation; оцінка результатів Accuracy, F1-score, Precision, Recall Отримані результати: було проведено три експерименти з різними параметрами низькорангової адаптації; з трьох експериментів було обрано найкращу модель та побудовано примітивну систему оцінки настроїв суспільства на її основі. У майбутніх дослідженнях пропонується застосувати низькорангову адаптацію до n останніх шарів, додати третій лінійний шар для класифікації релевантності допису користувача до питання та теми, збільшити кількість тренувальних даних. | |
dc.description.abstractother | The Diploma thesis contains 137 pages, 7 figures, 11 tables, 2 appendices, 36 references. Research subject – social media posts. Research objective – to build a classification model that can classify text for two separate tasks simultaneously; to create a primitive system for monitoring public sentiment on social media. Relevance of the research – application of large language models for multidimensional simultaneous classification tasks – assessment of public sentiment. Research methods – large language models, Low-Rank Adaptation, Weight- Decomposed Low-Rank Adaptation, Rank Stabilized Low-Rank Adaptation; evaluation of results: Accuracy, F1-score, Precision, Recall Obtained results – three experiments were conducted with different parameters of low-rank adaptation; the best model was selected from the three experiments and a primitive system for assessing public sentiment was built on its basis. For future research, it is proposed to apply low-rank adaptation to the last n layers, add a third linear layer to classify the relevance of a user's post to the question and topic, and increase the amount of training data. | |
dc.format.extent | 137 с. | |
dc.identifier.citation | Северин, О. В. Великі мовні моделі з використанням LoRA для одночасної подвійної класифікації тексту : дипломна робота ... бакалавра : 124 Системний аналіз / Северин Олександр Владиславович. – Київ, 2024. – 137 с. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/69044 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | великі мовні моделі | |
dc.subject | машинне навчання | |
dc.subject | задача класифікації | |
dc.subject | низькорангова адаптація | |
dc.subject | аналіз настроїв | |
dc.subject | розпізнавання позиції стосовно питання | |
dc.subject | large language models | |
dc.subject | machine learning | |
dc.subject | classification task | |
dc.subject | low-rank adaptation | |
dc.subject | sentiment analysis | |
dc.subject | position recognition on an issue | |
dc.title | Великі мовні моделі з використанням LoRA для одночасної подвійної класифікації тексту | |
dc.type | Bachelor Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Severyn_bakalavr.pdf
- Розмір:
- 4.95 MB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: