Шаповал, Наталія ВіталіївнаБезимянний, Олексій Євгенович2024-02-192024-02-192024Безимянний, О. Є. Фільтр конфіденційної інформації для чатів із великими лінгвістичними моделями та використання локальних текстових баз даних : магістерська дис. : 122 Комп'ютерні науки / Безимянний Олексій Євгенович. - Київ, 2024. - 81 с.https://ela.kpi.ua/handle/123456789/64677Магістерська дисертація: 81 с., 22 табл., 19 рис., 12 посилань, 1 додаток. Об’єкт дослідження – великі лінгвістичні моделі (LLM). Предмет дослідження – безпека їх використання разом з локальними текстовими базами даних. Метою роботи є створення такого фільтру, який би завадив витоку конфіденційної інформації та зловмисним маніпулюванням LLM, таким чином зробивши її безпечнішою відносно збереження особистої інформації. У магістерській дисертації виконано такі задачі: досліджено актуальність обраної теми, розглянуто підходи, методи та програми, що мають функціонал таких фільтрів, виявлені недоліки наявних методів, розроблено власний алгоритм та його реалізацію. Актуальність теми полягає у популярності використання LLM разом із локальними текстовими базами даних і відсутності належного захисту як LLM , так і конфіденційної інформації. У результаті створено фільтр як окремий функціональний блок із застосуванням семантичної подібності тексту для захисту конфіденційних даних та поліпшеною моделлю класифікації запитів, що має більшу швидкість та точність (0.85 проти 0.76 у найближчого конкурента). Семантичний фільтр не пропускає конфіденційну інформацію з вірогідністю 85%, порівняно з використанням заборони у промпті – 30%. Результати дослідження апробовано на двох конференціях та опубліковані у статті.81 с.ukсемантичий пошуквеликі лінгвістичні моделікласифікація запитівглибоке навчанняобробка природньої мовиконфіденційний фільтрзахист інформаціїsemantic searchlarge language modelsquery classificationdeep learningnatural language processingprivacy filterinformation protectionФільтр конфіденційної інформації для чатів із великими лінгвістичними моделями та використання локальних текстових баз данихMaster Thesis004.8.056.5(043.3)