Вилучення знань з великих мовних моделей: метод видалення шкідливих, авторських та приватних даних
Вантажиться...
Дата
2025
Автори
Науковий керівник
Назва журналу
Номер ISSN
Назва тому
Видавець
КПІ ім. Ігоря Сікорського
Анотація
Дипломна робота: 208 ст., 12 рис., 8 табл., 38 джерела, 1 додаток.
Об’єктом дослідження є методи вилучення знань із великих мовних моделей (LLM), які забезпечують селективне видалення приватних, ліцензійних та шкідливих відомостей без повного перетренування, зберігаючи загальну точність моделі.
Предметом дослідження виступають математичні та алгоритмічні підходи до селективного вилучення знань, а також методологія оцінювання цього процесу за допомогою існуючих і розроблених бенчмарків.
Метою роботи є створення уніфікованої методології й yoпрограмного забезпечення, які дозволяють точково видаляти небажані дані з LLM, одночасно підтримуючи корисну функціональність.
Актуальність зумовлена потребою гарантувати конфіденційність, дотримання авторських прав і протидію поширенню шкідливої інформації на тлі стрімкого зростання використання LLM та недостатньо досліджених методів розв’язання цих викликів.
Результатом роботи є програмна система, що реалізує запропоновану методологію вилучення знань для LLM і забезпечує їх оцінювання на уніфікованій шкалі.
Подальший розвиток передбачає удосконалення алгоритмів для точнішої інтеграції процедур вилучення знань, розширення набору бенчмарків, дослідження довготривалої стійкості моделей до повторних запитів на забуття та поліпшення підтримки багатомовних сценаріїв.
Опис
Ключові слова
великі мовні моделі, вилучення знань, право на забуття, копірайт, приватні дані, дезінформація
Бібліографічний опис
Баштовий, І. С. Вилучення знань з великих мовних моделей: метод видалення шкідливих, авторських та приватних даних : дипломна робота … бакалавра : 124 Системний аналіз / Баштовий Іван Сергійович. – Київ, 2025. – 210 с.