Consistency optimization methods in distributed NoSQL databases

dc.contributor.authorNikitin, Valerii
dc.contributor.authorKrуlov, Evgen
dc.date.accessioned2023-04-04T07:51:49Z
dc.date.available2023-04-04T07:51:49Z
dc.date.issued2022
dc.description.abstractРозподілена база даних представляє собою об’єднання за допомогою комп’ютерних мереж екземляри баз даних одного чи різних видів. Управління такими системами відбувається прозоро для кінцевих користувачів, що не можно сказати про аварійні ситуації та певні зміни у кількості вузлів. До глобально визначених властивостей відносяться консистенція, доступність та толерантність до розподілу. Вони з’являються внаслідок необхідності горизонтального розширення, що тягне за собою потребу у наявності копій зберігаємих даних. Це обумовлено не тільки питанням продуктивністі, але й питанням доступності. Ці дві властивості є діаметрально різними: технології та способи, які покращують одну з них, автоматично погіршують стан іншої. Окрім цього, будь-яка існуюча інформаційна система використовує великий набір алгоритмів. Кожен алгоритм є необхідним для вирішення тієї чи іншої задачі. Останні бувають достатньо різноманітними: сортування, структуризація та пошук даних, отримання унікального цифрового відбитку з набору даних. Можливості застосування не обмежені певним напрямком і тільки спонукають дослідників на пошук нових. До цього можно віднести алгоритми хешування, які знайшли широке використання у базах даних, у перевірці на цілісність файлів та мережевих пакетів. Хешування має широке використання і не обмежується використанням тільки для перевірки цілісності, а може бути використаний в якості аналогу для індексації замість збалансованих дерев за рахунок побудови хеш-таблиць [1]. Не дивлячись на велике різноманіття, виникають нові проблеми, які потребують вирішення. З розвитком технологій передачі даних та їх зберіганням, виникає потреба у покращенні підтримки консистентності у розподілених нереляційних базах даних. Існуючі алгоритми хешування є детермінованими та засновані на побітових операціях, які унеможливлюють прогнозування колізій. Таким чином, основною метою розробки нового алгоритму є ідея створення такого алгоритму, який покращить колізійну стійкість при зміні розміру вхідних даних та дозволить оцінити можливу кількість колізій.uk
dc.description.abstractotherA distributed database is a combination of copies of databases of one or different types using computer networks. Management of such systems is transparent to end users, that cannot be said about emergency situations and certain changes in the number of nodes. Globally defined properties include consistency, availability, and allocation tolerance. They appear as a result of the need for horizontal extension, which entails the need for copies of the stored data. This is due not only to the issue of productivity, but also to the issue of availability. These two properties are diametrically opposite: technologies and methods which improve one of them, worsen automatically the condition of the other. In addition, any existing information system uses a large set of algorithms. Each algorithm is necessary to solve some problem. The latter is quite diverse: sorting, structuring and searching for data, obtaining a unique digital fingerprint from a data set. The possibilities of usage are not limited to a certain direction and only encourage researchers to seek for new ones. This includes hashing algorithms, which are widely used in databases, in checking the integrity of files and network packets. Hashing has a wide range of usage and is not limited to use only for checking integrity, but can be used as an analogue for indexing instead of balanced trees by building hash tables [1]. Despite a great diversity, new problems arise that need to be solved. With the development of data transmission and storage technologies, there is a nicessity to improve consistency support in distributed NoSQL databases. Existing hashing algorithms are deterministic and based on bitwise operations, which make it impossible to predict collisions. Thus, the main goal of developing a new algorithm is the idea of creating such an algorithm that will improve collision resistance when changing the size of input data and which will allow estimating the possible number of collisions.uk
dc.format.pagerangeС. 27-30uk
dc.identifier.citationNikitin, V. Consistency optimization methods in distributed NoSQL databases / Valerii Nikitin, Evgen Krуlov // Інженерія програмного забезпечення і передові інформаційні технології (SoftTech-2022) : матеріали ІІ та ІІІ Всеукраїнських науково-практичних конференцій молодих вчених та студентів, присвячених 125-й річниці КПІ ім. Ігоря Сікорського (22–26 травня та 23-25 листопада 2022 р., Київ). – Київ : КПІ ім. Ігоря Сікорського, ІПІ ФІОТ, 2022. – С. 27-30. – Бібліогр.: 4 назви.uk
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/54240
dc.language.isoenuk
dc.publisherКПІ ім. Ігоря Сікорськогоuk
dc.publisher.placeКиївuk
dc.relation.ispartofМатеріали ІІ та ІІІ Всеукраїнських науково-практичних конференцій молодих вчених та студентів «Інженерія програмного забезпечення і передові інформаційні технології (SoftTech-2022)», присвячених 125-й річниці КПІ ім. Ігоря Сікорського, 22–26 травня та 23-25 листопада 2022 р., Київuk
dc.subjectрозподілені бази данихuk
dc.subjectрозподілені системиuk
dc.subjectхешуванняuk
dc.subjectхешфункціїuk
dc.subjectузгодженістьuk
dc.subjectстійкість до колізійuk
dc.subjectузгодженість данихuk
dc.subjectdistributed databasesuk
dc.subjectdistributed systemsuk
dc.subjecthashinguk
dc.subjecthash functionsuk
dc.subjectconsistencyuk
dc.subjectcollision resistanceuk
dc.subjectdata consistencyuk
dc.subject.udc004.65uk
dc.titleConsistency optimization methods in distributed NoSQL databasesuk
dc.typeArticleuk

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
P.27-30.pdf
Розмір:
352.09 KB
Формат:
Adobe Portable Document Format
Опис:
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
9.1 KB
Формат:
Item-specific license agreed upon to submission
Опис: