Атаки на великі мовні моделі та впровадження механізмів захисту

Сотнікова, Поліна Олегівна

Атаки на великі мовні моделі та впровадження механізмів захисту

Файли

Sotnikova_bakalavr.pdf (4.73 MB)

Дата

2024

Автори

Сотнікова, Поліна Олегівна

Науковий керівник

Родіонов, Андрій Миколайович

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Обсяг дипломної роботи 96 сторінок, 69 ілюстрацій, 2 таблиці, 1 додаток і 56 джерел літератури. Об’єкт дослідження: Великі мовні моделі. Предмет дослідження: Атаки на великі мовні моделі та механізми захисту. Мета дослідження: впровадження механізмів захисту великих мовних моделей для протидії атакам прямої ін’єкції запиту та витоку конфіденційної інформації. Методи дослідження: аналіз (аналіз наявних теоретичних джерел, що стосуються функціонування великих мовних моделей, документації, проєкту OWASP Top 10 for LLMs, звіту NIST AI), тестування атак прямої ін'єкції запиту на існуючих ВММ, збір наборів даних, тонке налаштування моделі, порівняння впроваджених механізмів. Отримані результати: були протестовані найефективніші методи захисту від атак на великі мовні моделі, отримана тонко налаштована модель TinyLlama, яка здатна протистояти існуючим маніпуляціям та отриманий анонімізований датасет, який можна використовувати для подальшого навчання моделей. Результати роботи були представлені на XXII Всеукраїнській науковопрактичній конференції студентів, аспірантів та молодих вчених «Теоретичні і прикладні проблеми фізики, математики та інформатики (13-17 травня 2024 р., м. Київ, Україна).

Ключові слова

велика мовна модель (ВММ), штучний інтелект (ШІ), ін’єкція запиту, джейлбрейк, тонке налаштування, large language model (LLM), artificial intelligence (AI), prompt injection, jailbreak, fine-tuning

Бібліографічний опис

Сотнікова, П. О. Атаки на великі мовні моделі та впровадження механізмів захисту : дипломна робота ... бакалавра : 125 Кібербезпека / Сотнікова Поліна Олегівна. – Київ, 2024. – 96с.

URI

https://ela.kpi.ua/handle/123456789/75995

Зібрання

Бакалаврські роботи (ІБ)
Бакалаврські роботи

Повна інформація про документ

Атаки на великі мовні моделі та впровадження механізмів захисту

Файли

Дата

Автори

Науковий керівник

Назва журналу

Номер ISSN

Назва тому

Видавець

Анотація

Опис

Ключові слова

Бібліографічний опис

ORCID

URI

DOI

Зібрання