Інтеграція алгоритму розподіленого машинного навчання і механізму диференціації конфіденційності в систему краудсенсінгу

Вантажиться...
Ескіз

Дата

2019-05

Назва журналу

Номер ISSN

Назва тому

Видавець

КПІ ім. Ігоря Сікорського

Анотація

Основною проблемою машинного навчання являється збір даних для тренування. Дану проблему можна вирішити шляхом збирання даних з портативних пристроїв які продукують велику кількість інформації по всьому світі. Для реалізації даного процесу, потрібен надійний механізм, що забезпечить анонімність зібраних даних. Адже з розвитком машинного навчання з’являються нові типи атак з метою крадіжки даних, тому потрібно удосконалювати методи конфіденційності у даній сфері. Найбільший внесок в даному напрямі зробила компанія GOOGLE. В 2017 році було представлено експериментальну технологію що заснована на трьох базових компонентах: краудсенсінг, розподілене машинне навчання та механізму гарантування анонімності даних. З допомогою такої технології можна навчати модель на портативних пристроях на їхніх власних даних. Але механізм забезпечення безпеки даних в системі має свої недоліки що спонукає до створення архітектури з використанням математичного апарату диференціальної приватності про що говориться в даній статті. Забезпечення безпеки даних для таких масштабних розподілених алгоритмах машинного навчання стоїть на першому місті. Тому актуальною є задача розробки методу збереження анонімності даних на базі математичного апарату диференціально приватності у розподіленому машинному навчанні. Мета дослідження: розробка методу забезпечення конфіденційності для розподіленого машинного навчання на індивідуальних даних користувача без втрати конфіденційності. Для реалізації поставленої мети були сформульовані наступні завдання:  дослідити існуючі подібні рішення;  розробити метод для підвищення надійності конфіденційності даних;  розробити алгоритми для клієнтської та серверної частини;  розробити систему яка має реалізовувати розроблений метод та виконувати захищений процес машинного навчання;  виконати експериментальне дослідження роботи розробленого методу. Об’єкт дослідження: процес забезпечення конфіденційності даних при розподіленому машинному навчанні. Предмет дослідження: використання диференціальної приватності в процесі розподіленого машинного навчання. Методи дослідження: методи тестування моделей машинного навчання, методи тестування програмного забезпечення, методи атаки на навчену модель для перевірки стійкості системи. Наукова новизна: вперше було використано математичний апарат диференціальної приватності для забезпечення конфіденційності розподіленого машинного навчання на портативних пристроях, що дозволяє захистити дані від більшості відомих атак включаючі нововиявлені. Було розроблено метод на базі створених автором алгоритмів які дозволили інтегрувати механізм диференціальної приватності в систему машинного навчання. Практичне значення отриманих результатів визначається тим, що розроблений метод покращує надійність захисту анонімності даних користувача та захищає від певних видів атак. Може бути застосований в системах де використовується розподілене машинне навчання на портативних пристроях. Створений програмний продукт може бути використаний для виявлення предмету їжі яка попала в поле зору камери. Розроблений метод перебуває в експериментальному стані. Зв’язок роботи з науковими програмами, планами, темами: робота пов’язана з темою математичних моделей та технологій в СППР. №0117U000914 Апробація: Основні положення роботи доповідались і обговорювались на науковій факультетській конференції ІСТУ-2019. Публікації: наукові положення дисертації опубліковані в II-му номері міжнародного наукового журналу «Інтернаука» 2019 року. «Інтегрування алгоритму розподіленого машинного навчання і механізму диференціальної конфіденційності в систему краудсенсінгу» / Романенко Лев Анатолійович – с. 93-98. IІ Всеукраїнська науково-практична конференція молодих вчених та студентів «Інформаційні системи та технології управління» (ІСТУ-2019). «Використання математичного апарату диференціальної приватності у розподіленому машинному навчанні для портативних пристроїв» / Романенко Лев Анатолійович.

Опис

Ключові слова

розподілене машинне навчання, диференціальна конфіденційність, краудсенсінг, distributed machine learning, differential privacy, crowdsensing

Бібліографічний опис

Романенко, Л. А. Інтеграція алгоритму розподіленого машинного навчання і механізму диференціації конфіденційності в систему краудсенсінгу : магістерська дис. : 121 Інженерія програмного забезпечення / Романенко Лев Анатолійович. – Київ, 2019. – 86 с.

DOI