Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних

Пригоцький, Антон Павлович

Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних

dc.contributor.advisor	Терейковський, Ігор Анатолійович
dc.contributor.author	Пригоцький, Антон Павлович
dc.date.accessioned	2024-09-30T12:55:39Z
dc.date.available	2024-09-30T12:55:39Z
dc.date.issued	2024
dc.description.abstract	Бакалаврський дипломний проєкт включає пояснювальну записку (51 стор., 17 рис., 2 табл., список використаної літератури з 7 найменувань, 5 додатків, 10 слайдів презентації). Об’єкт розробки – модуль розробки комп'ютерних засобів визначення сентименту в текстових даних, який дозволяє навчати довільні моделі обробки природної мови (NLP) для задач класифікації без надання попередньо підготовленого набору даних. Модуль дозволяє: генерувати набори даних за допомогою великих мовних моделей (LLM); здійснювати навчання NLP моделей на згенерованих датасетах; забезпечувати користувачам можливість опису задачі для класифікації та вибору типу моделі машинного навчання (ML). В процесі розробки були використані технології обробки природної мови, генеративні моделі LLM та алгоритми машинного навчання. В ході розробки: - проведено аналіз методів визначення сентименту в текстових даних; - сформульовані вимоги до модуля визначення сентименту; - розроблена архітектура модуля; - розроблено механізм генерації датасетів за допомогою LLM моделей; - реалізовано процес навчання NLP моделей; - проведено експериментальні дослідження та оцінку ефективності модуля. Упровадження цього модуля дозволить автоматизувати процес створення та навчання моделей для визначення сентименту в текстових даних, що зменшить трудозатратність та підвищить ефективність аналізу текстової інформації.
dc.description.abstractother	The bachelor's diploma project includes an explanatory note (51 pages, 17 figures, 2 tables, a list of used literature from 7 names, 5 applications, 10 presentation slides). The object of development is a module for the development of computer tools for determining sentiment in textual data, which allows training arbitrary models of natural language processing (NLP) for classification tasks without providing a previously prepared data set. The module allows: generating data sets using large language models (LLM); to train NLP models on the generated datasets; provide users with the ability to describe the task for classification and select the type of machine learning (ML) model. Natural language processing technologies, generative LLM models and machine learning algorithms were used in the development process. In the course of development: - an analysis of sentiment determination methods in textual data was carried out; - formulated requirements for the sentiment determination module; - developed module architecture; - a mechanism for generating datasets was developed; - the process of training NLP models has been implemented; - conducted experimental studies and evaluation of the module's effectiveness. The implementation of this module will allow automating the process of creating and training models for determining sentiment in textual data, which will reduce labor costs and increase the efficiency of textual information analysis.
dc.format.extent	70 с.
dc.identifier.citation	Пригоцький, А. П. Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних : дипломний проект ... бакалавра : 123 Комп'ютерна інженерія / Пригоцький Антон Павлович. – Київ, 2024. – 78 с.
dc.identifier.uri	https://ela.kpi.ua/handle/123456789/69387
dc.language.iso	uk
dc.publisher	КПІ ім. Ігоря Сікорського
dc.publisher.place	Київ
dc.subject	модуль визначення сентименту
dc.subject	обробка природної мови
dc.subject	великі мовні моделі
dc.subject	машинне навчання
dc.subject	sentiment detection module
dc.subject	natural language processing
dc.subject	large language models
dc.subject	machine learning
dc.title	Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних
dc.type	Bachelor Thesis

Файли

Контейнер файлів

Зараз показуємо 1 - 1 з 1

Назва:: Prygotsky_A_P_bakalavr.docx
Розмір:: 1.71 MB
Формат:: Microsoft Word XML

Завантажити

Ліцензійна угода

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 8.98 KB
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Зібрання

Бакалаврські роботи (СПСКС)
Бакалаврські роботи