Застосування LLM для синтезу класифікатора та класифікації новин
| dc.contributor.advisor | Савастьянов, Володимир Володимирович | |
| dc.contributor.author | Хоменко, Марина Олексіївна | |
| dc.date.accessioned | 2023-09-15T09:16:22Z | |
| dc.date.available | 2023-09-15T09:16:22Z | |
| dc.date.issued | 2023 | |
| dc.description.abstract | Квалiфiкацiйна робота мiстить: 99 стор., 26 рисунків, 9 таблиць, 23 джерела, 2 додатки. Дослідження присвячено визначенню можливостей застосування LLM (Large Language Model) для класифікації новин. Об'єктом дослідження є процедури класифікації новин, зокрема новин з області криптовалют за допомогою машинного навчання. Предметом дослідження є класифікатор, що використовує модель GPT за допомогою промтів та класифікатори, які синтезовані за допомогою LLM, а саме методи: опорних векторiв, логістичної регресії та наївний баєсовий метод. Мета роботи полягає в створенні класифікатора для криптоновин, використовуючи модель LLM, а також визначення найбільш точного методу для класифікації. Проведено дослідження, спрямоване на використання LLM з метою синтезу класифікатора та подальшої класифікації криптоновин. В ході виконання роботи було проведено аналіз різних методів машинного навчання та їх порівняльний аналіз. Детально описано процес обробки тексту, включаючи лексичний аналіз, видалення стоп-слів, стемінг, очищення тексту та токенізацію. Також було здійснено порівняння результатів класифікації, використовуючи класифікатори, створені з моделями, згенерованими за допомогою чату GPT, та класифікатор, що використовує модель GPT через API з використанням промтів. | uk |
| dc.description.abstractother | The qualification work consists of 99 pages, 26 figures, 9 tables, 23 references, 2 appendices. The research explores the possibilities of using LLM (Large Language Model) for news classification. The object of the study is the set of news classification procedures, specifically news related to cryptocurrencies, using machine learning. The subject of the research is the classifier that utilizes the GPT model through prompts and classifiers synthesized using LLM, namely Support Vector Machines, Logistic Regression, and Naive Bayes methods. The aim of the work is to create a classifier for cryptocurrency news using the LLM model and determine the most accurate method for classification. The research conducted focuses on utilizing LLM for synthesizing a classifier and performing classification of cryptocurrency news. During the work, an analysis of various machine learning methods and their comparative analysis was carried out. We described in details of the the text processing pipeline, including lexical analysis, stop-word removal, stemming, text cleaning, and tokenization. Additionally, a comparison of classification results was made using classifiers created with models generated through the GPT chat and a classifier utilizing the GPT model through API with the use of prompts. | uk |
| dc.format.extent | 99 с. | uk |
| dc.identifier.citation | Хоменко, М. О. Застосування LLM для синтезу класифікатора та класифікації новин : дипломна робота ... бакалавра : 124 Системний аналіз / Хоменко Марина Олексіївна. – Київ, 2023. – 99 с. | uk |
| dc.identifier.uri | https://ela.kpi.ua/handle/123456789/60368 | |
| dc.language.iso | uk | uk |
| dc.publisher.place | Київ | uk |
| dc.subject | машинне навчання | uk |
| dc.subject | класифiкацiя | uk |
| dc.subject | велика мовна модель | uk |
| dc.subject | чат gpt | uk |
| dc.subject | метод опорних векторiв | uk |
| dc.subject | лінійна регресія | uk |
| dc.subject | наївний баєсовий метод | uk |
| dc.subject | python | uk |
| dc.subject | machine learning | uk |
| dc.subject | classification | uk |
| dc.subject | large language model | uk |
| dc.subject | chat gpt | uk |
| dc.subject | support vector machines | uk |
| dc.subject | logistic regression | uk |
| dc.subject | naive bayes | uk |
| dc.title | Застосування LLM для синтезу класифікатора та класифікації новин | uk |
| dc.type | Bachelor Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Khomenko_bakalavr.pdf
- Розмір:
- 2.09 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: