Комп’ютерна система розподіленої реплікації даних між серверами PostgreSQL
dc.contributor.advisor | Романкевич, Віталій Олексій | |
dc.contributor.author | Русаков, Максим Віталійович | |
dc.date.accessioned | 2024-12-26T08:43:21Z | |
dc.date.available | 2024-12-26T08:43:21Z | |
dc.date.issued | 2024 | |
dc.description.abstract | Актуальність теми. У сучасних умовах розвитку технологій та глобалізації, ефективне управління великими обсягами даних стає одним з ключових факторів успішного функціонування підприємств. Особливо актуальним є питання побудови надійних та масштабованих систем управління даними, які можуть забезпечити безперервну роботу навіть у випадку відмови частини системи. Реплікація даних між серверами є основним інструментом для забезпечення високої доступності та надійності інформаційних систем. Тому розробка системи розподіленої реплікації даних між серверами PostgreSQL та застосування її на практиці є актуальною і важливою задачею, як з наукової, так і з практичної точки зору. Об’єктом дослідження є система реплікації даних між серверами PostgreSQL. Предметом дослідження є алгоритми та технології, що використовуються для розподіленої реплікації даних між серверами PostgreSQL, а також їх адаптація до різних сценаріїв і вимог для забезпечення ефективної, масштабованої та надійної роботи інформаційних систем. Мета роботи: аналіз існуючих методів і технологій реплікації; розробка та впровадження кастомних рішень для вибіркової реплікації окремих таблиць і рядків; дослідження та розробка ефективної системи розподіленої реплікації даних між серверами PostgreSQL; оптимізація процесу реплікації для забезпечення стабільності, масштабованості та продуктивності великих розподілених систем. Наукова новизна полягає в наступному: 1. Запропоновано модифікований підхід до вибіркової реплікації даних у системах PostgreSQL, що дозволяє зменшити навантаження на сервери та покращити ефективність передачі даних між ними. 2. Розроблено модифіковану систему кастомної реплікації даних між серверами PostgreSQL з використанням конфігураційних файлів, яка забезпечує гнучке управління напрямками передачі даних та вибіркову реплікацію окремих таблиць і рядків. Практична цінність отриманих в роботі результатів полягає в тому, що запропонована система розподіленої реплікації даних між серверами PostgreSQL забезпечує ефективну і надійну передачу даних у великих розподілених системах. Вона дозволяє скоротити час синхронізації даних між різними вузлами системи, підвищує продуктивність баз даних завдяки вибірковій реплікації окремих таблиць або рядків. Розроблені методи дозволяють адаптувати систему для реальних сценаріїв використання в бізнес-процесах, зокрема для оптимізації роботи з великими масивами даних і забезпечення безперервної роботи вузлів при збоях окремих серверів. Апробація роботи. Основні положення і результати роботи були представлені та обговорювались на VII Міжнародній науково-практичній конференції «Актуальні проблеми розвитку науки в контексті глобальних трансформацій інформаційного суспільства» (Київ, 30-31 жовтня 2024 р.) та на XVІІ науковій конференції магістрантів та аспірантів «Прикладна математика та комп’ютинг» ПМК-2024 (Київ, 20-22 листопада 2024 р.). Структура та обсяг роботи. Структура та обсяг роботи. Магістерська дисертація складається з вступу, чотирьох основних розділів та висновків. У вступі подано загальну характеристику роботи, описано сучасний стан проблеми, обґрунтовано актуальність теми дослідження, сформульовано мету та задачі роботи, а також наведено відомості про наукову новизну отриманих результатів і їх практичну цінність. У першому розділі розглянуто основні концепції та технології, що стосуються системи реплікації даних між серверами PostgreSQL, а також проаналізовано існуючі підходи до реалізації реплікації, що дозволяє виявити їхні переваги та недоліки. У другому розділі представлено результати дослідження архітектури та механізмів роботи PostgreSQL, зокрема особливості реплікації даних, алгоритми та методи, що використовуються для забезпечення цілісності та синхронізації інформації. У третьому розділі описано розроблену систему, включаючи вибіркову реплікацію окремих рядків таблиць, її реалізацію та практичні аспекти впровадження. У четвертому розділі викладено результати тестування та оцінки ефективності розробленої системи реплікації. Оцінено вплив реплікації на загальну продуктивність, проведено аналіз можливих збоїв та запропоновано методи їхнього усунення. Також здійснено порівняння ефективності розробленої системи з існуючими аналогами, що дозволило визначити переваги та слабкі сторони підходу. У висновках підсумовано результати проведеної роботи та обговорено перспективи подальших досліджень. Робота представлена на 91 аркушах та містить посилання на список використаних літературних джерел. Ключові слова: реплікація даних, PostgreSQL, система розподіленої реплікації, вибіркова реплікація, сервери бази даних, збереження даних, автоматизація. | |
dc.description.abstractother | Relevance of the Topic. In today’s technological and globalized environment, the effective management of large volumes of data is a critical factor for business success. Building reliable and scalable data management systems is especially crucial, as they ensure continuous operation even in the event of partial system failures. Data replication between servers is a fundamental tool for achieving high availability and reliability in information systems. Therefore, the development of a distributed data replication system between PostgreSQL servers and its practical application is both a timely and important task from both scientific and practical perspectives. Object of the Study. The object of this study is a data replication system between PostgreSQL servers. Subject of the Research. The subject involves the algorithms and technologies used for distributed data replication between PostgreSQL servers and their adaptation to various scenarios and requirements to ensure effective, scalable, and reliable information system operation. Purpose of the Work. The objective of this research is to analyze existing replication methods and technologies; to develop and implement custom solutions for selective replication of specific tables and rows; to investigate and create an efficient distributed data replication system between PostgreSQL servers; and to optimize the replication process to ensure stability, scalability, and performance in large distributed systems. Scientific Novelty. 1. A selective data replication modified approach in PostgreSQL systems has been proposed, reducing server load and enhancing data transmission efficiency. 2. A modified custom PostgreSQL server-to-server replication system has been developed using configuration files to allow flexible control of data transfer directions and selective replication of specific tables and rows. Practical Value of the Results. The distributed data replication system proposed in this work enables effective and reliable data transmission in large distributed systems. It reduces synchronization time between different nodes, enhances database performance through selective replication of tables or rows, and allows for real-world application in business processes, particularly optimizing large-scale data handling and ensuring continuous node operation in the event of individual server failures. Approbation of the Work. The main findings and results of this research were presented and discussed at the VII International Scientific and Practical Conference “Current Issues in the Development of Science in the Context of Global Transformations in the Information Society” (Kyiv, October 30-31, 2024) and at the XVII Scientific Conference for Master's and Ph.D. Students “Applied Mathematics and Computing” AMC-2024 (Kyiv, November 20-22, 2024). Structure and Scope of the Work. The master’s thesis comprises an introduction, four main chapters, and a conclusion. The introduction provides an overview of the work, describes the current state of the issue, justifies the relevance of the topic, formulates the purpose and objectives, and highlights the scientific novelty and practical value of the results. The first chapter reviews the core concepts and technologies related to data replication systems between PostgreSQL servers and analyzes existing approaches to replication implementation, identifying their strengths and weaknesses. The second chapter presents findings on PostgreSQL architecture and mechanisms, including data replication specifics, algorithms, and methods to ensure data integrity and synchronization. The third chapter describes the developed system, including selective replication of individual table rows, its implementation, and practical aspects of deployment. The fourth chapter details the testing and performance evaluation results of the developed replication system, analyzing the impact of replication on overall performance, potential failures, and suggested resolution methods. A comparison with existing solutions highlights the advantages and limitations of the approach. The conclusions summarize the results of the work conducted and discuss prospects for further research. The thesis is presented on 91 pages and includes references to the literature used. Keywords: data replication, PostgreSQL, distributed replication system, selective replication, database servers, data preservation, automation. | |
dc.format.extent | 82 с. | |
dc.identifier.citation | Русаков, М. В. Комп’ютерна система розподіленої реплікації даних між серверами PostgreSQL : магістерська дис. : 123 Комп'ютерна інженерія / Русаков Максим Віталійович. – Київ, 2024. – 82 с. | |
dc.identifier.uri | https://ela.kpi.ua/handle/123456789/71357 | |
dc.language.iso | uk | |
dc.publisher | КПІ ім. Ігоря Сікорського | |
dc.publisher.place | Київ | |
dc.subject | реплікація даних | |
dc.subject | PostgreSQL | |
dc.subject | система розподіленої реплікації | |
dc.subject | вибіркова реплікація | |
dc.subject | сервери бази даних | |
dc.subject | збереження даних | |
dc.subject | автоматизація | |
dc.subject | data replication | |
dc.subject | distributed replication system | |
dc.subject | selective replication | |
dc.subject | database servers | |
dc.subject | data preservation | |
dc.subject | automation | |
dc.subject.udc | 004.8 | |
dc.title | Комп’ютерна система розподіленої реплікації даних між серверами PostgreSQL | |
dc.type | Master Thesis |
Файли
Контейнер файлів
1 - 1 з 1
Ескіз недоступний
- Назва:
- Rusakov_MV_KV32mp_magistr_2024.docx
- Розмір:
- 1.58 MB
- Формат:
- Microsoft Word XML
Ліцензійна угода
1 - 1 з 1
Ескіз недоступний
- Назва:
- license.txt
- Розмір:
- 8.98 KB
- Формат:
- Item-specific license agreed upon to submission
- Опис: