Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних
dc.contributor.advisor | Терейковський, Ігор Анатолійович | |
dc.contributor.author | Пригоцький, Антон Павлович | |
dc.date.accessioned | 2024-09-30T12:55:39Z | |
dc.date.available | 2024-09-30T12:55:39Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Бакалаврський дипломний проєкт включає пояснювальну записку (51 стор., 17 рис., 2 табл., список використаної літератури з 7 найменувань, 5 додатків, 10 слайдів презентації). Об’єкт розробки – модуль розробки комп'ютерних засобів визначення сентименту в текстових даних, який дозволяє навчати довільні моделі обробки природної мови (NLP) для задач класифікації без надання попередньо підготовленого набору даних. Модуль дозволяє: генерувати набори даних за допомогою великих мовних моделей (LLM); здійснювати навчання NLP моделей на згенерованих датасетах; забезпечувати користувачам можливість опису задачі для класифікації та вибору типу моделі машинного навчання (ML). В процесі розробки були використані технології обробки природної мови, генеративні моделі LLM та алгоритми машинного навчання. В ході розробки: - проведено аналіз методів визначення сентименту в текстових даних; - сформульовані вимоги до модуля визначення сентименту; - розроблена архітектура модуля; - розроблено механізм генерації датасетів за допомогою LLM моделей; - реалізовано процес навчання NLP моделей; - проведено експериментальні дослідження та оцінку ефективності модуля. Упровадження цього модуля дозволить автоматизувати процес створення та навчання моделей для визначення сентименту в текстових даних, що зменшить трудозатратність та підвищить ефективність аналізу текстової інформації. | |
dc.description.abstractother | The bachelor's diploma project includes an explanatory note (51 pages, 17 figures, 2 tables, a list of used literature from 7 names, 5 applications, 10 presentation slides). The object of development is a module for the development of computer tools for determining sentiment in textual data, which allows training arbitrary models of natural language processing (NLP) for classification tasks without providing a previously prepared data set. The module allows: generating data sets using large language models (LLM); to train NLP models on the generated datasets; provide users with the ability to describe the task for classification and select the type of machine learning (ML) model. Natural language processing technologies, generative LLM models and machine learning algorithms were used in the development process. In the course of development: - an analysis of sentiment determination methods in textual data was carried out; - formulated requirements for the sentiment determination module; - developed module architecture; - a mechanism for generating datasets was developed; - the process of training NLP models has been implemented; - conducted experimental studies and evaluation of the module's effectiveness. The implementation of this module will allow automating the process of creating and training models for determining sentiment in textual data, which will reduce labor costs and increase the efficiency of textual information analysis. | |
dc.format.extent | 70 с. | |
dc.identifier.citation | Пригоцький, А. П. Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних : дипломний проект ... бакалавра : 123 Комп'ютерна інженерія / Пригоцький Антон Павлович. – Київ, 2024. – 78 с. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/69387 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | модуль визначення сентименту | |
dc.subject | обробка природної мови | |
dc.subject | великі мовні моделі | |
dc.subject | машинне навчання | |
dc.subject | sentiment detection module | |
dc.subject | natural language processing | |
dc.subject | large language models | |
dc.subject | machine learning | |
dc.title | Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних | |
dc.type | Bachelor Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Ескіз недоступний
- Назва:
- Prygotsky_A_P_bakalavr.docx
- Розмір:
- 1.71 MB
- Формат:
- Microsoft Word XML
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: