Шаповалова, Світлана ІгорівнаМар’яш, Дмитро Ігорович2025-01-212025-01-212024Мар’яш, Д. І. Аналіз тексту з використанням великих мовних моделей : магістерська дис. : 122 Комп’ютерні науки / Мар’яш Дмитро Ігорович. – Київ, 2024. – 157 с.https://ela.kpi.ua/handle/123456789/72082Актуальність теми дослідження. Автоматизація аналізу текстових даних є важливою складовою сучасного цифрового розвитку, особливо в умовах постійного зростання обсягів інформації, що генерується в різних сферах людської діяльності. Для забезпечення ефективного аналізу текстів важливими чинниками є застосування великих мовних моделей, які дозволяють автоматизувати процеси класифікації, генерації анотацій та створення контекстуальних запитань, підвищуючи якість та швидкість обробки інформації. Отже, розробка програмного забезпечення, яке інтегрує можливості таких моделей, є ключовим кроком для оптимізації роботи з текстовими даними. Метою дослідження є розробка середовища аналізу тексту з використанням великих мовних моделей, що дає змогу користувачеві класифікувати текстові дані за типом, темою, сентиментом та емоційним забарвленням, з можливістю візуалізації хмари слів, отримання ключових слів, а також автоматичній генерації анотації до тексту, разом із згенерованими тестами та контекстним чатом. Завдання дослідження: - дослідити та проаналізувати існуючі підходи до класифікації тексті; - проаналізувати методи класифікації текстів за типом, тематикою та емоційним забарвленням; - реалізувати механізм визначення типу тексту, його тематики та емоційного забарвлення; - розробити функціонал для автоматичної анотації текстових даних; - створити модуль формування змістовних запитань та відповідей на запитання на основі текстів для підвищення інтерактивності системи; - створити модуль автоматизованого тестування продуктивності великих мовних моделей. Об’єктом дослідження є алгоритми обробки природньої мови, великі мовні моделі та їх архітектури. Предметом дослідження є задача трансформування тексту у текст великих мовних (задачі класифікаціїї та анотації текстових даних), методи створення автоматизованих тестів, оцінювання продуктивності великих мовних моделей. Апробація результатів роботи. Основні положення даної роботи були викладені на XLIX Міжнародній науково-практичній конференції «New Areas of Scientific Research: Exploring New Frontiers» Дисертація складається зі вступу, п’яти розділів та висновків. Повний обсяг дисертації складає 136 сторінок, 25 таблиць, 39 рисунків, 6 сторінок списку використаних джерел у кількості 43 найменувань.157 с.ukLLMNLPвеликі мовні моделіобробка природної мовиT5BARTBERTгенераціяперетворення тексту у текстанотаціятекстові даніінтерпретаціяlarge language modelsnatural language processinggenerationtext-to-text conversionannotationtext datainterpretationАналіз тексту з використанням великих мовних моделейMaster Thesis