Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних

dc.contributor.advisorТерейковський, Ігор Анатолійович
dc.contributor.authorПригоцький, Антон Павлович
dc.date.accessioned2024-09-30T12:55:39Z
dc.date.available2024-09-30T12:55:39Z
dc.date.issued2024
dc.description.abstractБакалаврський дипломний проєкт включає пояснювальну записку (51 стор., 17 рис., 2 табл., список використаної літератури з 7 найменувань, 5 додатків, 10 слайдів презентації). Об’єкт розробки – модуль розробки комп'ютерних засобів визначення сентименту в текстових даних, який дозволяє навчати довільні моделі обробки природної мови (NLP) для задач класифікації без надання попередньо підготовленого набору даних. Модуль дозволяє: генерувати набори даних за допомогою великих мовних моделей (LLM); здійснювати навчання NLP моделей на згенерованих датасетах; забезпечувати користувачам можливість опису задачі для класифікації та вибору типу моделі машинного навчання (ML). В процесі розробки були використані технології обробки природної мови, генеративні моделі LLM та алгоритми машинного навчання. В ході розробки: - проведено аналіз методів визначення сентименту в текстових даних; - сформульовані вимоги до модуля визначення сентименту; - розроблена архітектура модуля; - розроблено механізм генерації датасетів за допомогою LLM моделей; - реалізовано процес навчання NLP моделей; - проведено експериментальні дослідження та оцінку ефективності модуля. Упровадження цього модуля дозволить автоматизувати процес створення та навчання моделей для визначення сентименту в текстових даних, що зменшить трудозатратність та підвищить ефективність аналізу текстової інформації.
dc.description.abstractotherThe bachelor's diploma project includes an explanatory note (51 pages, 17 figures, 2 tables, a list of used literature from 7 names, 5 applications, 10 presentation slides). The object of development is a module for the development of computer tools for determining sentiment in textual data, which allows training arbitrary models of natural language processing (NLP) for classification tasks without providing a previously prepared data set. The module allows: generating data sets using large language models (LLM); to train NLP models on the generated datasets; provide users with the ability to describe the task for classification and select the type of machine learning (ML) model. Natural language processing technologies, generative LLM models and machine learning algorithms were used in the development process. In the course of development: - an analysis of sentiment determination methods in textual data was carried out; - formulated requirements for the sentiment determination module; - developed module architecture; - a mechanism for generating datasets was developed; - the process of training NLP models has been implemented; - conducted experimental studies and evaluation of the module's effectiveness. The implementation of this module will allow automating the process of creating and training models for determining sentiment in textual data, which will reduce labor costs and increase the efficiency of textual information analysis.
dc.format.extent70 с.
dc.identifier.citationПригоцький, А. П. Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних : дипломний проект ... бакалавра : 123 Комп'ютерна інженерія / Пригоцький Антон Павлович. – Київ, 2024. – 78 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/69387
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectмодуль визначення сентименту
dc.subjectобробка природної мови
dc.subjectвеликі мовні моделі
dc.subjectмашинне навчання
dc.subjectsentiment detection module
dc.subjectnatural language processing
dc.subjectlarge language models
dc.subjectmachine learning
dc.titleМодуль розробки комп'ютерних засобів визначення сентименту в текстових даних
dc.typeBachelor Thesis

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
Prygotsky_A_P_bakalavr.docx
Розмір:
1.71 MB
Формат:
Microsoft Word XML
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: