Атаки на великі мовні моделі та впровадження механізмів захисту
Вантажиться...
Дата
2024
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Обсяг дипломної роботи 96 сторінок, 69 ілюстрацій, 2 таблиці, 1 додаток і 56 джерел літератури. Об’єкт дослідження: Великі мовні моделі. Предмет дослідження: Атаки на великі мовні моделі та механізми захисту. Мета дослідження: впровадження механізмів захисту великих мовних моделей для протидії атакам прямої ін’єкції запиту та витоку конфіденційної
інформації.
Методи дослідження: аналіз (аналіз наявних теоретичних джерел, що стосуються функціонування великих мовних моделей, документації, проєкту OWASP Top 10 for LLMs, звіту NIST AI), тестування атак прямої ін'єкції запиту на існуючих ВММ, збір наборів даних, тонке налаштування моделі, порівняння впроваджених механізмів. Отримані результати: були протестовані найефективніші методи захисту від атак на великі мовні моделі, отримана тонко налаштована модель TinyLlama, яка здатна протистояти існуючим маніпуляціям та отриманий анонімізований датасет, який можна використовувати для подальшого навчання моделей. Результати роботи були представлені на XXII Всеукраїнській науковопрактичній конференції студентів, аспірантів та молодих вчених «Теоретичні і прикладні проблеми фізики, математики та інформатики (13-17 травня 2024 р., м. Київ, Україна).
Опис
Ключові слова
велика мовна модель (ВММ), штучний інтелект (ШІ), ін’єкція запиту, джейлбрейк, тонке налаштування, large language model (LLM), artificial intelligence (AI), prompt injection, jailbreak, fine-tuning
Бібліографічний опис
Сотнікова, П. О. Атаки на великі мовні моделі та впровадження механізмів захисту : дипломна робота ... бакалавра : 125 Кібербезпека / Сотнікова Поліна Олегівна. – Київ, 2024. – 96с.