Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних

Пригоцький, Антон Павлович

Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних

Файли

Prygotsky_A_P_bakalavr.docx (1.71 MB)

Дата

2024

Автори

Пригоцький, Антон Павлович

Науковий керівник

Терейковський, Ігор Анатолійович

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Бакалаврський дипломний проєкт включає пояснювальну записку (51 стор., 17 рис., 2 табл., список використаної літератури з 7 найменувань, 5 додатків, 10 слайдів презентації). Об’єкт розробки – модуль розробки комп'ютерних засобів визначення сентименту в текстових даних, який дозволяє навчати довільні моделі обробки природної мови (NLP) для задач класифікації без надання попередньо підготовленого набору даних. Модуль дозволяє: генерувати набори даних за допомогою великих мовних моделей (LLM); здійснювати навчання NLP моделей на згенерованих датасетах; забезпечувати користувачам можливість опису задачі для класифікації та вибору типу моделі машинного навчання (ML). В процесі розробки були використані технології обробки природної мови, генеративні моделі LLM та алгоритми машинного навчання. В ході розробки: - проведено аналіз методів визначення сентименту в текстових даних; - сформульовані вимоги до модуля визначення сентименту; - розроблена архітектура модуля; - розроблено механізм генерації датасетів за допомогою LLM моделей; - реалізовано процес навчання NLP моделей; - проведено експериментальні дослідження та оцінку ефективності модуля. Упровадження цього модуля дозволить автоматизувати процес створення та навчання моделей для визначення сентименту в текстових даних, що зменшить трудозатратність та підвищить ефективність аналізу текстової інформації.

Ключові слова

модуль визначення сентименту, обробка природної мови, великі мовні моделі, машинне навчання, sentiment detection module, natural language processing, large language models, machine learning

Бібліографічний опис

Пригоцький, А. П. Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних : дипломний проект ... бакалавра : 123 Комп'ютерна інженерія / Пригоцький Антон Павлович. – Київ, 2024. – 78 с.

URI

https://ela.kpi.ua/handle/123456789/69387

Зібрання

Бакалаврські роботи (СПСКС)
Бакалаврські роботи

Повна інформація про документ

Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних

Файли

Дата

Автори

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Опис

Ключові слова

Бібліографічний опис

ORCID

URI

DOI

Зібрання