Моделі, методи та інформаційна технологія забезпечення групової анонімності даних
dc.contributor.author | Тавров, Данило Юрійович | |
dc.contributor.degreedepartment | прикладної математики | uk |
dc.contributor.degreefaculty | прикладної математики | uk |
dc.contributor.degreegrantor | Національний технічний університет України "Київський політехнічний інститут" | uk |
dc.date.accessioned | 2016-10-12T07:41:57Z | |
dc.date.available | 2016-10-12T07:41:57Z | |
dc.date.issued | 2016 | |
dc.description.abstracten | The thesis is devoted to solving a topical scientific and applied task of creating an information technology for providing data anonymity for groups when there is a threat of its violation in case of removing vital attributes from the microfile. For the first time fuzzy models of groups are proposed. These models help determine the degree of membership of microfile respondents in given groups by analyzing combinations of basic microfile attributes’ values. Fuzzy nature of the models enables us to handle uncertainty pertaining to the natural inaccuracy of statistical data. Adequacy criteria for such models are selected. A method for building a fuzzy model of a group when there is access to third-party data is developed. This method is an enhanced method for subgroup discovery, which differs from existing ones in the new quality measure of fuzzy rules for describing subgroups. The new measure takes into account disproportional relative dominance of subgroup elements over elements outside it in certain areas of the feature space. A method for building a fuzzy model of a group when there is no access to third-party data is developed. The method is based on utilizing expert knowledge and suggests its application to building a fuzzy rule base for a fuzzy inference system to determine degree of membership of a respondent in the group. The task of providing group anonymity is formalized as a minimum cost flow problem for a network, on whose architecture are imposed fuzzy restrictions. Criteria for evaluating solution quality are formalized, which enables us to evaluate solution quality without resorting to expert knowledge. For the first time, a memetic computing based method is proposed for solving this task. The developed method enables us to solve the task in one stage, which differs from the existing two-stage method in that it implies simultaneous masking of sensitive feature of data about a group and modifying the microfile in a way that ensures preserving sufficient level of data utility in terms of the introduced distortion. Applying this approach enables us to obtain task solutions of greater quality, due to the increased number of sufficient solutions. Information technology for providing data anonymity for groups when there is a threat of its violation by analyzing basic microfile attributes is enhanced. Functional requirements for the technology are proposed. A three-tier client-server architecture is selected for developing the technology. Information technology structure is described at hardware and software levels. The conceptual data model is described. It is verified that the technology satisfies all the requirements, i.e., it requires data to be stored in a database, takes into account basic microfile attributes, enables simultaneous modification of the model of a group and the microfile, automates the process of evaluating solution quality by automatic selection of solutions, is portable, exhibits high reliability and security, utilizes only open source software. Experiments conducted to test the technology by solving real data based tasks of providing group anonymity shows that the distortion introduced does not exceed 0.05% of microfile attribute values (on average), and time needed for modifying the microfile is reduced by the factor of 2.4 (on average). Main theoretical and practical results presented in the thesis were used in the State Statistics Service of Ukraine during preparation of 10% microdata of the 2001 All-Ukrainian census and development of a software system for microfile preparation within the UKR2U706 project supported by the UN Population Fund called “Increasing availability of disaggregated population data for national and sectoral development policymaking, programming and public use.” Theoretical results were deployed in the educational process at the Applied Mathematics Department of the National Technical University of Ukraine “Kyiv Polytechnic Institute” when preparing lectures and laboratory works for the “Soft Computing” course (for Specialists and Masters majoring in 7(8).04030101 “Applied Mathematics”). | uk |
dc.description.abstractru | Диссертация посвящена решению актуальной научно-прикладной задачи разработки информационной технологии обеспечения анонимности данных о группах, относительно которых существует угроза ее нарушения в случае удаления из микрофайла сущностных атрибутов. Предложены нечеткие модели групп, разработаны методы их построения. Разработан метод на основе меметических вычислений для решения задачи поиска в сети максимального потока минимальной стоимости, учитывающий нечеткие ограничения на ее архитектуру. Усовершенствована информационная технология, реализующая эти модели и методы. Основные результаты работы использованы в Госстате Украины при подготовке 10% микроданных Всеукраинской переписи населения 2001 г. и при создании системы подготовки микрофайлов при поддержке Фонда ООН в области народонаселения. | uk |
dc.description.abstractuk | Дисертацію присвячено розв’язанню науково-прикладної задачі створення інформаційної технології забезпечення анонімності даних про групи, щодо яких є загроза її порушення у випадку вилучення з мікрофайлу сутнісних атрибутів. Запропоновано нечіткі моделі груп, розроблено методи їх побудови. Розроблено метод на основі міметичних обислень розв’язання задачі пошуку в мережі максимального потоку мінімальної вартості, що враховує нечіткі обмеження на її архітектуру. Удосконалено інформаційну технологію, що реалізує ці моделі та методи. Основні результати роботи використано в Держстаті України під час підготовки 10% мікроданих Всеукраїнського перепису населення 2001 р. і створення системи підготовки мікрофайлів за підтримки Фонду ООН з питань народонаселення. | uk |
dc.format.page | 27 с. | uk |
dc.identifier.citation | Тавров Д. Ю. Моделі, методи та інформаційна технологія забезпечення групової анонімності даних : автореф. дис. ... канд. техн. наук. : 05.13.06 — інформаційні технології / Данило Юрійович Тавров. - Київ, 2016. - 27 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/17709 | |
dc.language.iso | uk | uk |
dc.publisher | НТУУ "КПІ" | uk |
dc.publisher.place | Київ | uk |
dc.status.pub | published | uk |
dc.subject | інформаційна технологія | uk |
dc.subject | групова анонімність даних | uk |
dc.subject | нечітка логіка | uk |
dc.subject | виявлення підгруп | uk |
dc.subject | міметичні обчислення | uk |
dc.subject | мікрофайл | uk |
dc.subject | информационная технология | ru |
dc.subject | групповая анонимность данных | ru |
dc.subject | нечеткая логика | ru |
dc.subject | выявление подгрупп | ru |
dc.subject | меметические вычисления | ru |
dc.subject | микрофайл | ru |
dc.subject | information technology | en |
dc.subject | data group anonymity | en |
dc.subject | fuzzy logic | en |
dc.subject | subgroup discovery | en |
dc.subject | memetic computing | en |
dc.subject | microfile | en |
dc.subject.udc | [004.9:004.056.5]:[004.023+510.6](043.3) | uk |
dc.title | Моделі, методи та інформаційна технологія забезпечення групової анонімності даних | uk |
dc.type | Thesis | uk |
thesis.degree.level | candidate | uk |
thesis.degree.name | кандидат технічних наук | uk |
thesis.degree.speciality | 05.13.06 – інформаційні технології | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Tavrov_aref.pdf
- Розмір:
- 840.57 KB
- Формат:
- Adobe Portable Document Format
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 7.71 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: