Верифікація користувача методами глибокого навчання на основі поведінкових та біометричних характеристик

dc.contributor.advisorДанилов, Валерій Якович
dc.contributor.authorГаврилович, Марія Павлівна
dc.date.accessioned2024-08-23T10:08:30Z
dc.date.available2024-08-23T10:08:30Z
dc.date.issued2024
dc.description.abstractГаврилович М.П. Верифікація користувача методами глибокого навчання на основі поведінкових та біометричних характеристик. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 122 “Комп’ютерні науки”. – Національний технічний університет України “Київський політехнічний інститут імені Ігоря Сікорського”, Київ, 2024. У дисертаційній роботі розглянуто питання побудови систем верифікації користувача на основі біометричних та поведінкових даних з допомогою нейронних мереж глибокого навчання. Потреба у надійних та високоефективних системах верифікації є надзвичайно актуальною у сфері безпеки, кібербезпеки, захисті персональних даних, медицини та ризикменеджменті. Традиційні методи верифікації, такі як паролі, карти доступу чи пін-коди і т.п. несуть великі ризики в разі їх втрати або компрометації, тому є потреба у побудові більш стійких систем безпеки та автентифікації. Біометричні дані є унікальними для кожного індивідуума, тому на їх основі можливо побудувати набагато надійніші системи верифікації. Неперервні біометричні та поведінкові сигнали, наприклад покази давачів руху (покази акселерометра, магнетометра, гіроскопа і т.п.), дають змогу реалізувати системи неперервної та неявної автентифікації. Оскільки біометричні сигнали є дуже складними по своїй природі, тому для розробки високоточної системи верифікації необхідна побудова нових потужних моделей, які мають високу предиктивну силу та можуть знаходити глибокі закономірності в даних з комплексною та глибокою структурою. Метою дослідження є розробка та аналіз методів машинного навчання, зокрема нейронних мереж глибокого навчання, для верифікації користувача на основі біометричних та поведінкових характеристик. У дисертації вперше отримані наступні нові наукові результати: 1. Розроблені нові гібридні архітектури, які базуються на стискуючих та варіаційних автокодувальниках з використанням трансформерів, для розв'язання задач верифікації на основі поведінкових та біометричних характеристик користувача, що дозволило досягти значного покращення критеріїв ефективності в порівнянні з існуючими методами. 2. На основі розроблених нових гібридних архітектур створена система підтримки прийняття рішень верифікації користувача. 3. Розроблено новий підхід для покращення точності систем біометричної верифікації, що базується на використанні величин фрактальних розмірностей. 4. Визначені та набули подальшого розвитку прикладні сценарії та компоненти системи верифікації на базі уточненої практичної методології побудови систем глибокого навчання на основі запропонованих архітектур. Теоретичне значення отриманих результатів полягає у вдосконаленні та подальшому розвитку методології побудови систем верифікації на базі нейронних мереж глибокого навчання. Створені та побудовані гібридні нейронні мережі дозволяють суттєво підвищити ефективність роботи систем біометричної верифікації, за рахунок поєднання переваг компонентів різних архітектур в одній нейронній мережі. На основі нових розроблених архітектур нейронних мереж виявлено та кількісно оцінено вплив величин фрактальних розмірностей на метрики якості систем верифікації. Практична цінність дисертаційної роботи: 1. розроблена оригінальна СППР неперервної біометричної верифікації користувача на основі нових гібридних архітектур нейронних мереж з використанням величин фрактальних розмірностей; 2. впроваджено в навчальний процес розроблені архітектури та уточнену методологію у вигляді відповідного силабусу, лекційного матеріалу та навчального посібника-практикума. Запропонована нова гібридна архітектура, яка базується на стискуючих автокодувальниках з використанням трансформерів, показує час висновку швидший на 31% відсоток та нижче в середньому на 11% відсотків значення рівного рівня помилок для всі типів фізичних активностей та їх комбінацій. Проведено аналіз впливу величин фрактальної розмірності Хігучі вхідних даних на ефективність системи верифікації на базі автокодувальників. Показано перевагу використання фрактальної розмірності даних на основні метрики якості, зокрема на рівний рівень помилок (в середньому на 13% відсотків нижче значення) та на значення площі під кривою (на 2.2% відсотків вищі показники) в порівнянні з системою верифікації без її врахування. Запропоновано СППР неперервної біометричної верифікації користувача на основі розроблених нових гібридних архітектур та з урахуванням фрактальної розмірності даних. На вхід розробленої системи надходять дані з різноманітних давачів (акселерометри, гіроскопи, магнетометри, тощо), які характеризують відповідні біометричні чи поведінкові показники особи. Під час етапу ініціалізації відбувається збір початкової необхідної кількості даних для тренування нових гібридних архітектур. На основі вдосконаленої практичної методології налаштування параметрів системи верифікації, перед тренуванням підбираються: відповідні значення розмірності вхідних даних в залежності від характеристик давачів; гіперпараметри архітектури нейронної мережі глибокого навчання; розраховується фрактальна розмірність даних кожного типу давача. В залежності від кількості та розмірності даних відбувається тренування моделей різних відповідних архітектур на окремих компонентах (скалярних, векторних) та на їх комбінаціях. Після тренування для кожної моделі отримуються значення відповідних критеріїв (час висновку, значення порогу верифікації). Відповідно до доступності сигналів для висновку системи верифікації вибирається модель, яка охоплює найбільший контекст та не перевищує установленого допустимого значення по часу висновку. Також, система має елемент моніторингу розподілу даних, який в залежності від їх зміни при необхідності ініціює дотренування моделей. Проведено порівняльний аналіз різних типів автокодувальників з класичними методами машинного навчання, як-от однокласові опорні машини векторів та ізоляційний ліс (Isolation Forest). Показано суттєву перевагу застосування автокодувальників над класичними методами машинного навчання, наприклад отримуємо на 7% вищу чутливість (recall) в порівнянні з ізоляційним лісом і на 75% вищу чутливість (recall) в порівнянні з однокласовими опорними машинами векторів. Також проведено глибокий аналіз впливу різних компонентів векторного біометричного сигналу та кількісно оцінено їх вплив на ефективність системи верифікації користувача. Встановлено, що в залежності від типу фізичної активності різні компоненти сигналу давача по різному впливають на метрики якості системи. Також, кількісно оцінено вплив компонентів сигналів давача в різних комбінаціях та доведено ефективність комбінацій компонентів векторного сигналу для досягнення вищої точності.
dc.description.abstractotherHavrylovych M. User verification with deep learning neural networks based on biometric and behavioral patterns – Qualifying scientific work, the manuscript. Thesis for a PhD degree in specialty 122 "Computer Science". – National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute", Kyiv, 2024. The dissertation discusses the issues of building user verification systems based on biometric and behavioral data using deep learning neural networks. The need for reliable and highly efficient verification systems is extremely relevant in the fields of security, cybersecurity, personal data protection, medicine, and risk management. Traditional verification methods, such as passwords, access cards, PIN codes, etc., carry significant risks in case of their loss or compromise, hence there is a need for building more robust security and authentication systems. Biometric data are unique to everyone, making it possible to build much more reliable verification systems. Continuous biometric and behavioral signals, such as motion sensor readings (accelerometer, magnetometer, gyroscope readings, etc.), allow for the implementation of continuous and implicit authentication systems. Since biometric signals are very complex by nature, developing a high-precision verification system requires building new powerful models that have high predictive power and can find deep patterns in data with a complex and deep structure. The goal of the research is to develop and analyze machine learning methods, particularly deep learning neural networks, for user verification based on biometric and behavioral characteristics. In the dissertation, the following new scientific results were obtained for the first time: 1. New hybrid architectures based on compressive and variational autoencoders using transformers were developed to solve user verification tasks based on behavioral and biometric characteristics, which allowed for significant improvement in efficiency criteria compared to existing methods. 2. Based on the developed new hybrid architectures, a user verification decision support system was created. 3. A new approach for improving the accuracy of biometric verification systems, based on the use of fractal dimension magnitudes, was developed. 4. Applied scenarios and components of the verification system based on a refined practical methodology for building deep learning systems based on the proposed architectures were identified and further developed. The theoretical significance of the obtained results lies in the improvement and further development of the methodology for building verification systems based on deep learning neural networks. The created and constructed hybrid neural networks allow for a significant increase in the efficiency of biometric verification systems, due to the combination of advantages of components from different architectures in one neural network. Based on the new developed neural network architectures, the impact of fractal dimension magnitudes on the quality metrics of verification systems was discovered and quantitatively assessed. The practical value of the dissertation work: 1. An original continuous biometric verification user support system based on new hybrid neural network architectures using fractal dimension magnitudes was developed; 2. The developed architectures and refined methodology were implemented in the educational process in the form of the corresponding syllabus, lecture materials, and a training manual-practicum. The proposed new hybrid architecture, based on compressive autoencoders using transformers, shows a 31% faster inference time and on average 11% lower equal error rate values for all types of physical activities and their combinations. An analysis of the impact of fractal dimension magnitudes on verification systems based on autoencoders was conducted. The positive impact of fractal dimension on the main quality metrics, specifically an average of 13% lower equal error rate and 2.2% higher area under the curve value compared to the method without fractal dimension, was proven. An automated system for continuous biometric user verification has been proposed, based on newly developed hybrid architectures and taking into account the fractal dimension of the data. The system receives input data from a variety of sensors (accelerometers, gyroscopes, magnetometers, etc.), which characterize the corresponding biometric or behavioral indicators of a person. During the initialization phase, an initial necessary amount of data is collected for training the new hybrid architectures. Based on an improved practical methodology for setting verification system parameters, appropriate values for the dimensions of input data are selected depending on the characteristics of the sensors before training; hyper-parameters of the deep learning neural network architecture are adjusted; and the fractal dimension of data for each type of sensor is calculated. Depending on the amount and dimensions of the data, models of various corresponding architectures are trained on individual components (scalar, vector) and their combinations. After training, each model yields values for the relevant criteria (inference time, verification threshold value). Depending on the availability of signals for inference, the system selects the model that covers the broadest context and does not exceed the established permissible value for inference time. Additionally, the system includes a data distribution monitoring element, which, depending on changes in the data, may initiate retraining of the models if necessary. A comparative analysis of different types of autoencoders with classic machine learning methods, such as one-class support vector machines and isolation forest, was conducted. A significant advantage of autoencoders compared to classic machine learning methods was shown, for example, a 7% higher recall than with the isolation forest and almost 75% higher recall than with one-class support vector machines. A deep analysis of the impact of various components of the biometric signal and their quantitative impact on the efficiency of the biometric verification system of the user was conducted. Depending on the type of physical activity, different signal components of the sensor affect the quality metrics of the system differently. Also, the impact of signal components in combination with each other was quantitatively assessed. Overall, it was shown that individual components significantly vary in their impact on quality metrics and demonstrate the effectiveness of combining components to achieve higher accuracy.
dc.format.extent126 с.
dc.identifier.citationГаврилович, М. П. Верифікація користувача методами глибокого навчання на основі поведінкових та біометричних характеристик : дис. … д-ра філософії : 122 Комп’ютерні науки / Гаврилович Марія Павлівна. – Київ, 2024. – 126 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/68499
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectнейронні мережі глибокого навчання
dc.subjectгібридні нейронні мережі
dc.subjectавтокодувальники
dc.subjectавтокодувальник на базі трансформера
dc.subjectрекурентний автокодувальник
dc.subjectбіометрична верифікація
dc.subjectфрактальна розмірність
dc.subjectneural networks
dc.subjectautoencoder
dc.subjecthybrid neural networks
dc.subjecttransformerbased autoencoder
dc.subjectrecurrent autoencoder
dc.subjectbiometric verification
dc.subjectfractal dimension
dc.subject.udc004.89
dc.titleВерифікація користувача методами глибокого навчання на основі поведінкових та біометричних характеристик
dc.typeThesis Doctoral

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Havrylovych_dys.pdf
Розмір:
2.83 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: