Дослідження парадигми керування потоками даних в системах збереження та обробки даних
dc.contributor.advisor | Харченко, Костянтин Васильович | |
dc.contributor.author | Кузьмінова, Анна Анатоліївна | |
dc.date.accessioned | 2023-04-25T14:46:01Z | |
dc.date.available | 2023-04-25T14:46:01Z | |
dc.date.issued | 2021-12 | |
dc.description.abstract | Робота виконана на 133 сторінках, містить 45 ілюстрацій, 24 таблиці. При підготовці використовувалася література з 20 джерел. Актуальність теми Упродовж останніх кількох років ми можемо спостерігати процес цифрової трансформації, який торкнувся майже всіх сфер життя, оскільки світ не може існувати без інформації. Та чим більше розвиваються технології, тим простіше та доступніше стає процес розповсюдження даних с більшим масштабом. В цьому наповненому інформацією світі займає виграшні позиції той, хто вміє даними правильно розпоряджатися. Але зростає не лише об’єм інформації, а ще й кількість джерел, з яких вона надходить. А для прийняття найкращих рішень потрібно об’єднати ці дані в якесь одне джерело та працювати вже з ним, в чому допомагає інтеграція даних, основною робочою сутністю якої є керовані потоки даних. Мета і завдання дослідження Метою цієї роботи є продовженням циклу досліджень кафедрою теми керування потоками даних з фокусуванням на практичному застосуванні. Поставлена мета передбачає розв’язок цілої низки конкретних завдань, а саме: дослідження парадигми керування потоками даних; дослідження потокової архітектури; дослідження особливостей інтеграції даних з різнорідних систем; огляд наявних засобів для керування потоками даних; використовуючи отримані під час дослідження знання, розробити методологію та провести тестування систем інтеграції даних. Об’єкт та предмет дослідження. Об'єктом дослідження є парадигма керування потоками даних. Предметом дослідження є практичний аспект роботи парадигми керування потоками даних на прикладі систем інтеграції даних. Рішення поставлених завдань і досягнуті результати За результатами здійсненого дослідження було розроблено методологію тестування систем інтеграції даних, а також проведено саме тестування на системах, які підтримують ETL сценарій та проаналізовано результати; для чого було спроектовано спрощену схему майбутнього Data Lake, створено тестові набори даних, налаштовано тестове середовище та продумано схему інтеграції. Наукова новизна одержаних результатів. Розроблено методологію тестування систем інтеграції даних. | uk |
dc.description.abstractother | The master's thesis is made on 133 pages containing 45 illustrations and 24 tables. When preparing the dissertation, literature from 20 sources was used. Actuality of theme. In the last few years, we can observe a digital transformation which affected almost all spheres of life, because the world cannot exist without information. But the more technology evolves, the easier and more accessible the process of disseminating larger-scale data becomes. In this full of information world, the one who knows how to manage data properly, wins. But it is not only the amount of information that is growing, but also the number of sources from which it comes. And for making best decisions, you need to combine this data into one source and work with it, which helps the data integration, the main working essence of which is managed data flows The purpose and objectives of the study The purpose of this work is to continue the cycle of department’s researches of dataflow management with a focus on practical application. This goal involves the solution of a number of specific tasks, namely: research of dataflow management paradigm; research of dataflow paradigm; research of features of data integration from heterogeneous systems; overview of available data flow management tools; using the knowledge gained during the research, develop a methodology and test data integration systems. Object and subject of research The object of study is the paradigm of data flow management. The subject of research is the practical aspect of the paradigm of data flow management on the example of data integration systems. Solution of tasks and achieved results Based on the results of the study, a methodology for testing data integration systems was developed, as well as testing on systems that support the ETL scenario and analyzed the results; for which a simplified scheme of the future Data Lake was designed, test data sets were created, a test environment was configured and an integration scheme was devised. Scientific novelty of the obtained results. A methodology for testing data integration systems has been developed. | uk |
dc.format.extent | 133 с. | uk |
dc.identifier.citation | Кузьмінова, А. А. Дослідження парадигми керування потоками даних в системах збереження та обробки даних : магістерська дис. : 122 Комп’ютерні науки / Кузьмінова Анна Анатоліївна. – Київ, 2021. – 133 с. | uk |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/54917 | |
dc.language.iso | uk | uk |
dc.publisher | КПІ ім. Ігоря Сікорського | uk |
dc.publisher.place | київ | uk |
dc.subject | потоки даних | uk |
dc.subject | інтеграція даних | uk |
dc.subject | системи збереження та обробки даних | uk |
dc.subject | бази даних | uk |
dc.subject | тестування | uk |
dc.subject | ETL | uk |
dc.subject | dataflow | uk |
dc.subject | data integration | uk |
dc.subject | data storage and processing systems | uk |
dc.subject | database | uk |
dc.subject | testing | uk |
dc.subject.udc | 004.42 | uk |
dc.title | Дослідження парадигми керування потоками даних в системах збереження та обробки даних | uk |
dc.type | Master Thesis | uk |
Файли
Контейнер файлів
1 - 1 з 1
Вантажиться...
- Назва:
- Kuzminova_magistr.pdf
- Розмір:
- 2.72 MB
- Формат:
- Adobe Portable Document Format
- Опис:
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 9.1 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: