Застосування LLM для синтезу класифікатора та класифікації новин

dc.contributor.advisorСавастьянов, Володимир Володимирович
dc.contributor.authorХоменко, Марина Олексіївна
dc.date.accessioned2023-09-15T09:16:22Z
dc.date.available2023-09-15T09:16:22Z
dc.date.issued2023
dc.description.abstractКвалiфiкацiйна робота мiстить: 99 стор., 26 рисунків, 9 таблиць, 23 джерела, 2 додатки. Дослідження присвячено визначенню можливостей застосування LLM (Large Language Model) для класифікації новин. Об'єктом дослідження є процедури класифікації новин, зокрема новин з області криптовалют за допомогою машинного навчання. Предметом дослідження є класифікатор, що використовує модель GPT за допомогою промтів та класифікатори, які синтезовані за допомогою LLM, а саме методи: опорних векторiв, логістичної регресії та наївний баєсовий метод. Мета роботи полягає в створенні класифікатора для криптоновин, використовуючи модель LLM, а також визначення найбільш точного методу для класифікації. Проведено дослідження, спрямоване на використання LLM з метою синтезу класифікатора та подальшої класифікації криптоновин. В ході виконання роботи було проведено аналіз різних методів машинного навчання та їх порівняльний аналіз. Детально описано процес обробки тексту, включаючи лексичний аналіз, видалення стоп-слів, стемінг, очищення тексту та токенізацію. Також було здійснено порівняння результатів класифікації, використовуючи класифікатори, створені з моделями, згенерованими за допомогою чату GPT, та класифікатор, що використовує модель GPT через API з використанням промтів.uk
dc.description.abstractotherThe qualification work consists of 99 pages, 26 figures, 9 tables, 23 references, 2 appendices. The research explores the possibilities of using LLM (Large Language Model) for news classification. The object of the study is the set of news classification procedures, specifically news related to cryptocurrencies, using machine learning. The subject of the research is the classifier that utilizes the GPT model through prompts and classifiers synthesized using LLM, namely Support Vector Machines, Logistic Regression, and Naive Bayes methods. The aim of the work is to create a classifier for cryptocurrency news using the LLM model and determine the most accurate method for classification. The research conducted focuses on utilizing LLM for synthesizing a classifier and performing classification of cryptocurrency news. During the work, an analysis of various machine learning methods and their comparative analysis was carried out. We described in details of the the text processing pipeline, including lexical analysis, stop-word removal, stemming, text cleaning, and tokenization. Additionally, a comparison of classification results was made using classifiers created with models generated through the GPT chat and a classifier utilizing the GPT model through API with the use of prompts.uk
dc.format.extent99 с.uk
dc.identifier.citationХоменко, М. О. Застосування LLM для синтезу класифікатора та класифікації новин : дипломна робота ... бакалавра : 124 Системний аналіз / Хоменко Марина Олексіївна. – Київ, 2023. – 99 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/60368
dc.language.isoukuk
dc.publisher.placeКиївuk
dc.subjectмашинне навчанняuk
dc.subjectкласифiкацiяuk
dc.subjectвелика мовна модельuk
dc.subjectчат gptuk
dc.subjectметод опорних векторiвuk
dc.subjectлінійна регресіяuk
dc.subjectнаївний баєсовий методuk
dc.subjectpythonuk
dc.subjectmachine learninguk
dc.subjectclassificationuk
dc.subjectlarge language modeluk
dc.subjectchat gptuk
dc.subjectsupport vector machinesuk
dc.subjectlogistic regressionuk
dc.subjectnaive bayesuk
dc.titleЗастосування LLM для синтезу класифікатора та класифікації новинuk
dc.typeBachelor Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Khomenko_bakalavr.pdf
Розмір:
2.09 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: