Методи та програмне забезпечення аналізу графа Біткоїн-транзакцій

dc.contributor.advisorОнай, Микола Володимирович
dc.contributor.authorЖикін, Юрій Сергійович
dc.date.accessioned2026-05-11T07:29:56Z
dc.date.available2026-05-11T07:29:56Z
dc.date.issued2026
dc.description.abstractЖикін Ю. С. Методи та програмне забезпечення аналізу графа Біткоїн-транзакцій. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії в галузі знань 12 Інформаційні технології за спеціальністю 121 Інженерія програмного забезпечення. – Національний технічний університет України “Київський політехнічний інститут імені Ігоря Сікорського”, Київ, 2026. Протягом майже двох десятиліть з моменту своєї появи Біткоїн став важливим компонентом глобальної фінансової системи. Біткоїн водночас є системою мікроплатежів та електронної готівки, активом приватних інвестицій, інструментом міжнародних розрахунків і навіть складовою державних фінансових стратегій. Незалежність Біткоїна від державних і банківських інституцій робить його привабливим фінансовим інструментом для користувачів у політично чи економічно нестабільних регіонах. Доступ індивідуального користувача до Біткоїна практично неможливо обмежити, оскільки для більшості операцій з Біткоїном достатньо навіть низькошвидкісного доступу до Інтернету, але у цьому контексті особливо важливим є питання анонімності користувачів і безпеки їхніх персональних даних. Біткоїн, як і більшість інших криптовалютних систем, не є абсолютно анонімним. Біткоїн-протокол базується на відкритому реєстрі транзакцій, який містить всю історію операцій за весь час існування системи, і у цьому реєстрі кожен користувач представлений одним або багатьма псевдонімами, які називають адресами. Транзакції в Біткоїні утворюють складний граф переходів власності, і аналіз цього графа дає змогу встановлювати соціально-економічні зв'язки між користувачами чи організаціями, знаходити множини адрес, що належать одному й тому ж користувачу, і навіть деанонімізувати окремих користувачів. З одного боку такі можливості є корисними для правоохоронних органів у боротьбі з шахрайством, відмиванням коштів і іншою злочинною діяльністю, а також для фінансових установ у моделюванні ринку та прогнозуванні економічних процесів. З іншого боку такі можливості ставлять під загрозу право індивідуальних користувачів на приватність їхніх фінансових даних. Втім, аналіз можливостей деанонімізації користувачів допомагає виявляти слабкі місця у моделі приватності Біткоїна, що в свою чергу сприяє розробці нових протоколів та інструментів, спрямованих на покращення приватності користувачів. Дослідження методів аналізу графа Біткоїн-транзакцій є актуальним як з точки зору окремого користувача з метою захисту персональних фінансових даних від несанкціонованого втручання, так і з точки зору правоохоронних органів та організацій з метою розпізнавання операцій, що можуть вказувати на потенційну злочинну діяльність, або прямої протидії фінансових злочинам. Розроблення відкритих програмних систем аналізу графа Біткоїн-транзакцій є корисним для підвищення безпеки всієї Біткоїн-екосистеми, як з точки зору індивідуального користувача, так і з точки зору правоохоронних органів. Метою дисертаційної роботи є спрощення процесів розроблення та експлуатації програмного забезпечення для аналізу графа Біткоїн-транзакцій шляхом розроблення узагальненої архітектури програмної системи на основі спеціалізованої моделі транзакційних даних, яка надає уніфікований семантичний контракт для інтеграції програмних компонентів і забезпечує масштабоване оброблення історії транзакцій. У першому розділі дисертаційної роботи розглянуто історичні й економічні передумови появи Біткоїна і вплив цих передумов на деякі аспекти Біткоїн-протоколу. Проведено аналіз Біткоїн-протоколу і його транзакційної моделі, розглянуто структуру транзакцій і механізм формування блоків. Проаналізовано проблему приватності користувачів і технології аналізу графа Біткоїн-транзакцій з метою деанонімізації користувачів, а також розглянуто існуючі рекомендації та інструменти збереження приватності. Сформульовано загальну концепцію програмної системи, що дає змогу будувати і розширювати граф знань про транзакції, а також здійснювати патерновий аналіз такого графа. Насамкінець, сформульовано вимоги до такої програмної системи. У другому розділі розроблено спеціалізовану RDF-модель даних Біткоїн-транзакцій, адаптовану для пошуків патернів типових операцій. Для цього розглянуто підграфи графа Біткоїн-транзакцій і обрано граф, що відображає і транзакції, і транзакційні виходи, а також аргументовано вибір технології представлення великих графів, і графів знань зокрема. Розглянуто можливості використання SPARQL як універсальної мови запитів для патернового аналізу, а також розглянуто можливості розширення SPARQL спеціалізованими фільтр-функціями для спрощення складних запитів. У третьому розділі запропоновано концепцію пошуку типових операцій у графі Біткоїн-транзакцій за допомогою евристичних патернів, а також її реалізацію з використанням RDF-графа знань і SPARQL. Розроблено метод кластеризації виходів транзакцій на основі пошуку евристичних патернів типових фінансових операцій та пропагації зв'язків власності в межах таких патернів. Показано, що використання RDF-графа знань дає змогу зберігати результати проміжних ітерацій, виконувати інкрементальну кластеризацію й доповнювати її новими евристиками. Також сформульовано ідеї системного захисту від патернового аналізу графа транзакцій шляхом заміни існуючих раціональних стратегій менеджменту виходів на більш випадкові, які руйнують евристичний аналіз. Запропоновано метод захисту від патернового аналізу операцій консолідації шляхом багатокрокової симуляції операцій платежу одному отримувачу. У четвертому розділі розробляється архітектура програмної системи для побудови, розширення та дослідження графа знань про Біткоїн-транзакції, що складається з компонентів для збору даних, ETL-інтрументів, RDF-сховища графа знань, автоматизованого компоненту пропагації зв'язків та користувацького інтерфейсу для дослідження графа. Розроблено процес завантаження Біткоїн-блоків із підтримкою обробки реорганізацій ланцюга. Для реалізації і інтеграції решти компонентів розроблено і розміщено у відкритому доступі бібліотеку для взаємодії з Біткоїн-мережею з програмного середовища Common Lisp. У дисертаційній роботі отримано низку нових наукових результатів, зокрема вперше розроблено спеціалізовану модель даних Біткоїн-транзакцій, характерною рисою якої є відображення транзакцій, виходів транзакцій, власників виходів та довільних зовнішніх анотацій у єдиному RDF-графі з додатковими атрибутами, обчисленими на етапі побудови, що надає уніфікований семантичний контракт для інтеграції компонентів програмної системи аналізу графа транзакцій, забезпечує зберігання усієї історії транзакцій в межах єдиного сховища даних і уможливлює класи запитів для пошуку типових операцій, що складаються з однієї і більше транзакцій і відбуваються протягом тривалих проміжків часу. Уперше запропоновано метод евристичної кластеризації виходів Біткоїн-транзакцій, який ґрунтується на використанні спеціалізованого RDF-графа знань про Біткоїн-транзакції, що відображає повну історію транзакцій та довільні зовнішні анотації, зокрема результати попередніх аналізів, і відрізняється можливістю інкрементального виконання кластеризації з покроковою пропагацією зв'язків власності між виходами транзакцій відповідно до евристичного визначення типів операцій та збереженням проміжних результатів безпосередньо у графі знань. Уперше запропоновано метод захисту від патернового аналізу операцій консолідації виходів транзакцій, характерною рисою якого є багатокроковий процес, який симулює платежі з одним отримувачем і створює у графі транзакцій складний, стійкий до розпізнавання підграф операції, що дає змогу знижувати ризики деанонімізації та розкриття чутливої фінансової інформації. Уперше запропоновано узагальнену архітектуру програмної системи для аналізу графа Біткоїн-транзакцій, у якій спеціалізована модель транзакційних даних використовується як онтологічне ядро, що об'єднує транзакції, їхні виходи, власників та зовнішні метадані в межах єдиного RDF-графа, забезпечує накопичення внутрішніх і зовнішніх знань про транзакції у єдиному сховищі та надає уніфікований стандартизований інтерфейс взаємодії з графом знань. Основні наукові результати дисертаційної роботи опубліковано у 7 наукових працях, зокрема у 3 наукових статтях, що належать до фахових виданнях, включених до переліку наукових фахових видань України з присвоєнням категорії «Б», та у 4 матеріалах науково-технічних конференцій.
dc.description.abstractotherZhykin Y. Methods and Software for Bitcoin Transaction Graph Analysis. – Qualifying scientific work, manuscript. PhD thesis in the field of knowledge 12 Information technologies in specialty 121 Software Engineering. – National Technical University of Ukraine “Igor Sikorsky Kyiv Polytechnic Institute”, Kyiv, 2026. In nearly two decades since its emergence, Bitcoin has become an important component of the global financial system. At the same time, Bitcoin serves as a system for micropayments and electronic cash, a private investment asset, a tool for international settlements, and even a part of state financial strategies. Bitcoin's independence from governmental and banking institutions makes it an attractive financial instrument for users in politically or economically unstable regions. Access to Bitcoin for individual users is practically impossible to restrict, since most Bitcoin operations require only low-bandwidth Internet access, but the issue of user anonymity and the security of their personal data becomes especially important in this context. Bitcoin, as well as most other cryptocurrency systems, is not absolutely anonymous. Bitcoin protocol is based on an open transaction ledger that contains the complete history of all operations since the system's inception. In this ledger, each user is represented by one or more pseudonyms, known as addresses. Bitcoin transactions form a complex graph of ownership transfers, and analyzing this graph allows to discover socio-economic links between users or organizations, identify sets of addresses belonging to the same user, and even deanonymize individual users. On the one hand, such capabilities are useful for law enforcement for combating fraud, money laundering and other criminal activities, as well as for financial institutions for market modeling and economic forecasting. On the other hand, these capabilities infringe on the rights of individual users to the privacy of their financial data. Nevertheless, studying the possibilities of user deanonymization helps discover weaknesses in Bitcoin's privacy model, which in turn contributes to the development of new protocols and tools aimed at improving user privacy. The study of methods of Bitcoin transaction graph analysis is relevant both from the point of view of individual users (protecting personal financial data from unauthorized access) and from the point of view of law enforcement agencies and organizations (detecting operations that may indicate potential criminal activity or directly countering financial crimes). The development of open software systems for Bitcoin transaction graph analysis is beneficial for enhancing the security of the entire Bitcoin ecosystem, both from the standpoint of individual users and from that of law enforcement authorities. The purpose is to simplify the processes of development and operation of software for analyzing the Bitcoin transaction graph by designing a generalized software system architecture based on a specialized transaction data model that provides a unified semantic contract for integrating software components and ensures scalable processing of the transaction history. In the first section of the dissertation, the historical and economic prerequisites for the emergence of Bitcoin and their influence on certain aspects of the Bitcoin protocol are examined. An analysis of the Bitcoin protocol and its transaction model is conducted, including a discussion of transaction structure and the block formation mechanism. The problem of user privacy and technologies for analyzing the Bitcoin transaction graph with the aim of user deanonymization are analyzed, and existing recommendations and tools for preserving privacy are reviewed. A general concept of a software system is formulated that enables the construction and extension of a transaction knowledge graph, as well as pattern-based analysis of such a graph. Finally, the requirements for such a software system are defined. In the second section, a specialized RDF model of the Bitcoin transaction data is developed, adapted for the discovery of patterns of typical operations. To this end, subgraphs of the Bitcoin transaction graph are identified, and a graph representation that captures both transactions and transaction outputs is selected. The choice of technologies for representing large-scale graphs, and knowledge graphs in particular, is justified. The use of SPARQL as a universal query language for pattern-based analysis is examined, and the possibilities of extending SPARQL with specialized filter functions to simplify complex queries are also considered. In the third section, a concept for identifying typical operations in the Bitcoin transaction graph using heuristic patterns is proposed, along with its implementation based on an RDF knowledge graph and SPARQL. A method for clustering transaction outputs is developed based on the detection of heuristic patterns of typical financial operations and the propagation of ownership relations within such patterns. It is shown that the use of an RDF knowledge graph enables the preservation of intermediate iteration results, supports incremental clustering, and allows the incorporation of new heuristics. In addition, ideas for system-level protection against pattern-based analysis of the transaction graph are formulated by replacing existing rational output management strategies with more randomized ones that disrupt heuristic analysis. A method for protection against pattern-based analysis of consolidation operations is proposed based on a multi-step simulation of payment operations to a single recipient. In the fourth section, the architecture of a software system for constructing, extending, and analyzing a knowledge graph of Bitcoin transactions is developed. The system consists of components for data collection, ETL tools, an RDF knowledge graph store, an automated component for propagating ownership relations, and a user interface for graph exploration. A process for loading Bitcoin blocks with support for handling blockchain reorganizations is developed. To implement and integrate the remaining components, a library for interacting with the Bitcoin network from the Common Lisp programming environment is developed and released as open-source software. The dissertation has produced a number of new scientific results, in particular by developing for the first time, a specialized data model for Bitcoin transactions, whose distinguishing feature is the representation of transactions, transaction outputs, output owners, and arbitrary external annotations within a single RDF graph with additional attributes computed at the construction stage, providing a unified semantic contract for integrating components of a software system for transaction graph analysis, ensuring the storage of the entire transaction history within a single data repository, and enabling classes of queries for identifying typical operations consisting of one or more transactions occurring over extended periods of time. For the first time, an algorithmic–software method for heuristic clustering of Bitcoin transaction outputs is proposed, which is based on the use of a specialized RDF knowledge graph of Bitcoin transactions that represents the complete transaction history and arbitrary external annotations, including the results of prior analyses, and is distinguished by the ability to perform clustering incrementally with step-by-step propagation of ownership relations between transaction outputs in accordance with heuristic definitions of operation types, while storing intermediate results directly within the knowledge graph. For the first time, an algorithmic–software method for increasing resistance to pattern analysis of transaction output consolidation operations is proposed, whose distinguishing feature is a multi-step process that simulates payments to a single recipient and constructs a complex operation subgraph within the transaction graph that is robust to recognition, thereby enabling the reduction of de-anonymization risks and the disclosure of sensitive financial information. For the first time, a generalized software system architecture for Bitcoin transaction graph analysis is proposed, in which a specialized transaction data model is used as an ontological core that unifies transactions, their outputs, owners, and external metadata within a single RDF graph, enables the accumulation of internal and external knowledge about transactions in a unified data repository, and provides a unified standardized interface for interacting with the transaction knowledge graph. The main scientific results of the dissertation have been published in 7 scientific works, including 3 scientific articles published in professional journals included in the list of scientific journals of Ukraine in category “Б”, as well as 4 materials of scientific and technical conferences.
dc.format.extent220 с.
dc.identifier.citationЖикін, Ю. С. Методи та програмне забезпечення аналізу графа Біткоїн-транзакцій : дис. ... д-ра філософії : 121 Інженерія програмного забезпечення / Жикін Юрій Сергійович. - Київ, 2026. - 220 с.
dc.identifier.urihttps://ela.kpi.ua/handle/123456789/80747
dc.language.isouk
dc.publisherКПІ ім. Ігоря Сікорського
dc.publisher.placeКиїв
dc.subjectінженерія програмного забезпечення
dc.subjectархітектура програмного забезпечення
dc.subjectприкладне програмне забезпечення
dc.subjectкриптовалюта
dc.subjectблокчейн
dc.subjectБіткоїн
dc.subjectсоціальні мережі
dc.subjectвиявлення шахрайства
dc.subjectграф залежностей
dc.subjectграф знань
dc.subjectонтологія
dc.subjectRDF/OWL
dc.subjectевристики
dc.subjectаналіз даних
dc.subjectкластеризація
dc.subjectsoftware engineering
dc.subjectsoftware architecture
dc.subjectapplication software
dc.subjectcryptocurrency
dc.subjectblockchain
dc.subjectBitcoin
dc.subjectsocial networks
dc.subjectfraud detection
dc.subjectdependency graph
dc.subjectknowledge graph
dc.subjectontology
dc.subjectheuristics
dc.subjectdata analysis
dc.subjectclustering
dc.subject.udc004.65:519.17
dc.titleМетоди та програмне забезпечення аналізу графа Біткоїн-транзакцій
dc.title.alternativeMethods and Software for Bitcoin Transaction Graph Analysis
dc.typeThesis Doctoral

Файли

Контейнер файлів
Зараз показуємо 1 - 1 з 1
Вантажиться...
Ескіз
Назва:
Zhykin_dys.pdf
Розмір:
5.19 MB
Формат:
Adobe Portable Document Format
Ліцензійна угода
Зараз показуємо 1 - 1 з 1
Ескіз недоступний
Назва:
license.txt
Розмір:
8.98 KB
Формат:
Item-specific license agreed upon to submission
Опис: