Дослідження парадигми керування потоками даних в системах збереження та обробки даних

dc.contributor.advisorХарченко, Костянтин Васильович
dc.contributor.authorКузьмінова, Анна Анатоліївна
dc.date.accessioned2023-04-25T14:46:01Z
dc.date.available2023-04-25T14:46:01Z
dc.date.issued2021-12
dc.description.abstractРобота виконана на 133 сторінках, містить 45 ілюстрацій, 24 таблиці. При підготовці використовувалася література з 20 джерел. Актуальність теми Упродовж останніх кількох років ми можемо спостерігати процес цифрової трансформації, який торкнувся майже всіх сфер життя, оскільки світ не може існувати без інформації. Та чим більше розвиваються технології, тим простіше та доступніше стає процес розповсюдження даних с більшим масштабом. В цьому наповненому інформацією світі займає виграшні позиції той, хто вміє даними правильно розпоряджатися. Але зростає не лише об’єм інформації, а ще й кількість джерел, з яких вона надходить. А для прийняття найкращих рішень потрібно об’єднати ці дані в якесь одне джерело та працювати вже з ним, в чому допомагає інтеграція даних, основною робочою сутністю якої є керовані потоки даних. Мета і завдання дослідження Метою цієї роботи є продовженням циклу досліджень кафедрою теми керування потоками даних з фокусуванням на практичному застосуванні. Поставлена мета передбачає розв’язок цілої низки конкретних завдань, а саме: дослідження парадигми керування потоками даних; дослідження потокової архітектури; дослідження особливостей інтеграції даних з різнорідних систем; огляд наявних засобів для керування потоками даних; використовуючи отримані під час дослідження знання, розробити методологію та провести тестування систем інтеграції даних. Об’єкт та предмет дослідження. Об'єктом дослідження є парадигма керування потоками даних. Предметом дослідження є практичний аспект роботи парадигми керування потоками даних на прикладі систем інтеграції даних. Рішення поставлених завдань і досягнуті результати За результатами здійсненого дослідження було розроблено методологію тестування систем інтеграції даних, а також проведено саме тестування на системах, які підтримують ETL сценарій та проаналізовано результати; для чого було спроектовано спрощену схему майбутнього Data Lake, створено тестові набори даних, налаштовано тестове середовище та продумано схему інтеграції. Наукова новизна одержаних результатів. Розроблено методологію тестування систем інтеграції даних.uk
dc.description.abstractotherThe master's thesis is made on 133 pages containing 45 illustrations and 24 tables. When preparing the dissertation, literature from 20 sources was used. Actuality of theme. In the last few years, we can observe a digital transformation which affected almost all spheres of life, because the world cannot exist without information. But the more technology evolves, the easier and more accessible the process of disseminating larger-scale data becomes. In this full of information world, the one who knows how to manage data properly, wins. But it is not only the amount of information that is growing, but also the number of sources from which it comes. And for making best decisions, you need to combine this data into one source and work with it, which helps the data integration, the main working essence of which is managed data flows The purpose and objectives of the study The purpose of this work is to continue the cycle of department’s researches of dataflow management with a focus on practical application. This goal involves the solution of a number of specific tasks, namely:  research of dataflow management paradigm;  research of dataflow paradigm;  research of features of data integration from heterogeneous systems;  overview of available data flow management tools;  using the knowledge gained during the research, develop a methodology and test data integration systems. Object and subject of research The object of study is the paradigm of data flow management. The subject of research is the practical aspect of the paradigm of data flow management on the example of data integration systems. Solution of tasks and achieved results Based on the results of the study, a methodology for testing data integration systems was developed, as well as testing on systems that support the ETL scenario and analyzed the results; for which a simplified scheme of the future Data Lake was designed, test data sets were created, a test environment was configured and an integration scheme was devised. Scientific novelty of the obtained results. A methodology for testing data integration systems has been developed.uk
dc.format.extent133 с.uk
dc.identifier.citationКузьмінова, А. А. Дослідження парадигми керування потоками даних в системах збереження та обробки даних : магістерська дис. : 122 Комп’ютерні науки / Кузьмінова Анна Анатоліївна. – Київ, 2021. – 133 с.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/54917
dc.language.isoukuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeкиївuk
dc.subjectпотоки данихuk
dc.subjectінтеграція данихuk
dc.subjectсистеми збереження та обробки данихuk
dc.subjectбази данихuk
dc.subjectтестуванняuk
dc.subjectETLuk
dc.subjectdataflowuk
dc.subjectdata integrationuk
dc.subjectdata storage and processing systemsuk
dc.subjectdatabaseuk
dc.subjecttestinguk
dc.subject.udc004.42uk
dc.titleДослідження парадигми керування потоками даних в системах збереження та обробки данихuk
dc.typeMaster Thesisuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Kuzminova_magistr.pdf
Розмір:
2.72 MB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: