Інтеграція алгоритму розподіленого машинного навчання і механізму диференціації конфіденційності в систему краудсенсінгу

dc.contributor.advisorФіногенов, Олексій Дмитрович
dc.contributor.authorРоманенко, Лев Анатолійович
dc.date.accessioned2020-03-05T09:11:21Z
dc.date.available2020-03-05T09:11:21Z
dc.date.issued2019-05
dc.description.abstractenThe main problem of machine learning is the collection of data for training. This problem can be solved by collecting data from portable devices that generate a lot of information around the world. To implement this process, you need a reliable mechanism that will ensure the anonymity of the data collected. After all, with the development of machine learning there are new types of attacks to steal data, so you need to improve the privacy practices in this area. The greatest contribution in this direction was made by GOOGLE. In 2017, experimental technology was presented based on three basic components: cursing, distributed machine learning and a mechanism to guarantee the anonymity of data. With this technology, you can teach a model on portable devices on their own data. But the mechanism of data security in the system has its disadvantages that prompts the creation of architecture using the mathematical apparatus of differential privacy as described in this article. The provision of data security for such large-scale distributed algorithms of machine learning is in the first city. Therefore, the task of developing a method for preserving anonymity of data on the basis of the mathematical apparatus of differential privacy in a distributed machine learning is actual. The purpose of the research: the development of algorithms and the method based on them, which will allow to safely execute the collection and process of distributed machine learning on the user's individual data without loss of confidentiality To achieve the goal, the following objectives were formulated:  to investigate existing similar solutions;  to propose a method for increasing the reliability of data confidentiality based on the developed algorithms that provide the interaction of components of the system;  develop a system that should implement the developed method and implement a secure machine learning process;  to carry out an experimental study of the work of the developed method. Object of research: the process of ensuring the confidentiality of data in distributed machine learning. Subject of research: the use of differential privacy in the process of distributed machine learning. Methods of research: methods of testing machine learning models, software testing methods, methods of attacking a trained model to verify system stability. Scientific novelty: the scientific novelty of the study is that for the first time the mathematical apparatus of differential privacy was used to ensure the confidentiality of distributed machine learning on portable devices. A method was developed on the basis of algorithms created by the author that allowed to integrate the mechanism of differential privacy into the system of machine learning. The practical value of the results obtained is determined by the fact that the developed method improves the reliability of the protection of anonymity of user data and protects against certain types of attacks. Relationship of work with scientific programs, plans, themes: the work is connected with the topic of distributed machine learning and the process of data anonymization. Approbation: The main provisions of the work were reported and discussed at the scientific faculty conference ISTU-2019. Publications: the scientific provisions of the dissertation are published in the 2nd issue of the international scientific journal "Internauca" in 2019. "Integration of Distributed Machine Learning Algorithm and Differential Confidentiality Mechanism into the Kravdsensing System" / Romanenko Lev Anatolievich - p. 93-98uk
dc.description.abstractukОсновною проблемою машинного навчання являється збір даних для тренування. Дану проблему можна вирішити шляхом збирання даних з портативних пристроїв які продукують велику кількість інформації по всьому світі. Для реалізації даного процесу, потрібен надійний механізм, що забезпечить анонімність зібраних даних. Адже з розвитком машинного навчання з’являються нові типи атак з метою крадіжки даних, тому потрібно удосконалювати методи конфіденційності у даній сфері. Найбільший внесок в даному напрямі зробила компанія GOOGLE. В 2017 році було представлено експериментальну технологію що заснована на трьох базових компонентах: краудсенсінг, розподілене машинне навчання та механізму гарантування анонімності даних. З допомогою такої технології можна навчати модель на портативних пристроях на їхніх власних даних. Але механізм забезпечення безпеки даних в системі має свої недоліки що спонукає до створення архітектури з використанням математичного апарату диференціальної приватності про що говориться в даній статті. Забезпечення безпеки даних для таких масштабних розподілених алгоритмах машинного навчання стоїть на першому місті. Тому актуальною є задача розробки методу збереження анонімності даних на базі математичного апарату диференціально приватності у розподіленому машинному навчанні. Мета дослідження: розробка методу забезпечення конфіденційності для розподіленого машинного навчання на індивідуальних даних користувача без втрати конфіденційності. Для реалізації поставленої мети були сформульовані наступні завдання:  дослідити існуючі подібні рішення;  розробити метод для підвищення надійності конфіденційності даних;  розробити алгоритми для клієнтської та серверної частини;  розробити систему яка має реалізовувати розроблений метод та виконувати захищений процес машинного навчання;  виконати експериментальне дослідження роботи розробленого методу. Об’єкт дослідження: процес забезпечення конфіденційності даних при розподіленому машинному навчанні. Предмет дослідження: використання диференціальної приватності в процесі розподіленого машинного навчання. Методи дослідження: методи тестування моделей машинного навчання, методи тестування програмного забезпечення, методи атаки на навчену модель для перевірки стійкості системи. Наукова новизна: вперше було використано математичний апарат диференціальної приватності для забезпечення конфіденційності розподіленого машинного навчання на портативних пристроях, що дозволяє захистити дані від більшості відомих атак включаючі нововиявлені. Було розроблено метод на базі створених автором алгоритмів які дозволили інтегрувати механізм диференціальної приватності в систему машинного навчання. Практичне значення отриманих результатів визначається тим, що розроблений метод покращує надійність захисту анонімності даних користувача та захищає від певних видів атак. Може бути застосований в системах де використовується розподілене машинне навчання на портативних пристроях. Створений програмний продукт може бути використаний для виявлення предмету їжі яка попала в поле зору камери. Розроблений метод перебуває в експериментальному стані. Зв’язок роботи з науковими програмами, планами, темами: робота пов’язана з темою математичних моделей та технологій в СППР. №0117U000914 Апробація: Основні положення роботи доповідались і обговорювались на науковій факультетській конференції ІСТУ-2019. Публікації: наукові положення дисертації опубліковані в II-му номері міжнародного наукового журналу «Інтернаука» 2019 року. «Інтегрування алгоритму розподіленого машинного навчання і механізму диференціальної конфіденційності в систему краудсенсінгу» / Романенко Лев Анатолійович – с. 93-98. IІ Всеукраїнська науково-практична конференція молодих вчених та студентів «Інформаційні системи та технології управління» (ІСТУ-2019). «Використання математичного апарату диференціальної приватності у розподіленому машинному навчанні для портативних пристроїв» / Романенко Лев Анатолійович.uk
dc.format.page86 с.uk
dc.identifier.citationРоманенко, Л. А. Інтеграція алгоритму розподіленого машинного навчання і механізму диференціації конфіденційності в систему краудсенсінгу : магістерська дис. : 121 Інженерія програмного забезпечення / Романенко Лев Анатолійович. – Київ, 2019. – 86 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/32125
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.subjectрозподілене машинне навчанняuk
dc.subjectдиференціальна конфіденційністьuk
dc.subjectкраудсенсінгuk
dc.subjectdistributed machine learninguk
dc.subjectdifferential privacyuk
dc.subjectcrowdsensinguk
dc.subject.udc004uk
dc.titleІнтеграція алгоритму розподіленого машинного навчання і механізму диференціації конфіденційності в систему краудсенсінгуuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Romanenko_magistr.pdf
Розмір:
2.35 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.06 KB
Формат:
Item-specific license agreed upon to submission
Опис: