Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних
Ескіз недоступний
Дата
2024
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Бакалаврський дипломний проєкт включає пояснювальну записку (51 стор., 17 рис., 2 табл., список використаної літератури з 7 найменувань, 5 додатків, 10 слайдів презентації).
Об’єкт розробки – модуль розробки комп'ютерних засобів визначення сентименту в текстових даних, який дозволяє навчати довільні моделі обробки природної мови (NLP) для задач класифікації без надання попередньо підготовленого набору даних.
Модуль дозволяє: генерувати набори даних за допомогою великих мовних моделей (LLM); здійснювати навчання NLP моделей на згенерованих датасетах; забезпечувати користувачам можливість опису задачі для класифікації та вибору типу моделі машинного навчання (ML). В процесі розробки були використані технології обробки природної мови, генеративні моделі LLM та алгоритми машинного навчання.
В ході розробки:
- проведено аналіз методів визначення сентименту в текстових даних;
- сформульовані вимоги до модуля визначення сентименту;
- розроблена архітектура модуля;
- розроблено механізм генерації датасетів за допомогою LLM моделей;
- реалізовано процес навчання NLP моделей;
- проведено експериментальні дослідження та оцінку ефективності модуля.
Упровадження цього модуля дозволить автоматизувати процес створення та навчання моделей для визначення сентименту в текстових даних, що зменшить трудозатратність та підвищить ефективність аналізу текстової інформації.
Опис
Ключові слова
модуль визначення сентименту, обробка природної мови, великі мовні моделі, машинне навчання, sentiment detection module, natural language processing, large language models, machine learning
Бібліографічний опис
Пригоцький, А. П. Модуль розробки комп'ютерних засобів визначення сентименту в текстових даних : дипломний проект ... бакалавра : 123 Комп'ютерна інженерія / Пригоцький Антон Павлович. – Київ, 2024. – 78 с.