Розроблення алгоритму ідентифікації фази накопичення з урахуванням кластерного аналізу on-chain-метрик
Анотація: Актуальність дослідження зумовлена необхідністю створення інструментів об’єктивної ідентифікації фаз ринку цифрових активів на основі поведінкових характеристик учасників мережі, які фіксуються не ціновими, а ончейн-метриками (on-chain). У сучасних умовах зростання волатильності криптовалютного ринку та недостатньої ефективності класичних індикаторів технічного аналізу збільшується попит на алгоритми, здатні виявляти латентні ринкові стани, зокрема фазу накопичення, ще до настання цінових змін. Мета статті полягає у створенні алгоритмічної моделі виявлення фази накопичення на криптовалютному ринку шляхом застосування кластерного аналізу до множини ончейн-індикаторів, що дозволяє підвищити точність і своєчасність оцінки ринкової динаміки для використання в системах підтримки інвестиційних рішень. Методологія дослідження базується на використанні поведінкових метрик блокчейн-мереж (Realized Cap HODL Waves, Dormancy, SOPR, Exchange Outflow Volume, Address Balance Distribution) та алгоритмів кластерного навчання без учителя. Застосовано HDBSCAN як основний метод кластеризації, що дозволяє адаптивно ідентифікувати ринкові фази без фіксації їх кількості. Побудовано процедурну схему, що охоплює етапи збору, оброблення, нормалізації даних, кластерного розподілу та інтерпретації результатів. Результати дослідження відображають побудову ефективного алгоритму, здатного групувати часові відрізки за подібністю ончейн-поведінки та виділяти фази акумуляції з урахуванням часової динаміки метрик. Реалізовано архітектуру класифікації, яка не залежить від цінових даних і може функціонувати в реальному часі в складі систем криптоаналітики. У висновках доведено ефективність запропонованої моделі для виявлення фаз накопичення на основі динаміки структур ончейн-даних. Установлено, що алгоритм здатний забезпечити раннє виявлення змін ринкової поведінки та знизити залежність від традиційних спекулятивних індикаторів. Перспективи подальших досліджень пов’язані з інтеграцією часових залежностей у кластерну модель, розширенням системи на інші цифрові активи, впровадженням агрегованих індексів накопичення та самонавчальних компонентів з урахуванням макроекономічних і позамережевих впливів.
Бібліографічний опис статті:
Якушев Денис. Розроблення алгоритму ідентифікації фази накопичення з урахуванням кластерного аналізу on-chain-метрик//Наука онлайн: Міжнародний електронний науковий журнал - 2020. - №12. - https://nauka-online.com/publications/information-technology/2020/12/38-4/
Інформаційні технології
УДК 004.855:336.763.3
Якушев Денис Олександрович
незалежний дослідник
Yakushev Denys
Independent Researcher
ORCID: 0009-0003-7444-1677
https://www.doi.org/10.25313/2524-2695-2020-12-38-4
РОЗРОБЛЕННЯ АЛГОРИТМУ ІДЕНТИФІКАЦІЇ ФАЗИ НАКОПИЧЕННЯ З УРАХУВАННЯМ КЛАСТЕРНОГО АНАЛІЗУ ON-CHAIN-МЕТРИК
DEVELOPMENT OF AN ALGORITHM FOR IDENTIFYING THE ACCUMULATION PHASE TAKING INTO ACCOUNT CLUSTER ANALYSIS OF ON-CHAIN METRICS
Анотація. Актуальність дослідження зумовлена необхідністю створення інструментів об’єктивної ідентифікації фаз ринку цифрових активів на основі поведінкових характеристик учасників мережі, які фіксуються не ціновими, а ончейн-метриками (on-chain). У сучасних умовах зростання волатильності криптовалютного ринку та недостатньої ефективності класичних індикаторів технічного аналізу збільшується попит на алгоритми, здатні виявляти латентні ринкові стани, зокрема фазу накопичення, ще до настання цінових змін.
Мета статті полягає у створенні алгоритмічної моделі виявлення фази накопичення на криптовалютному ринку шляхом застосування кластерного аналізу до множини ончейн-індикаторів, що дозволяє підвищити точність і своєчасність оцінки ринкової динаміки для використання в системах підтримки інвестиційних рішень.
Методологія дослідження базується на використанні поведінкових метрик блокчейн-мереж (Realized Cap HODL Waves, Dormancy, SOPR, Exchange Outflow Volume, Address Balance Distribution) та алгоритмів кластерного навчання без учителя. Застосовано HDBSCAN як основний метод кластеризації, що дозволяє адаптивно ідентифікувати ринкові фази без фіксації їх кількості. Побудовано процедурну схему, що охоплює етапи збору, оброблення, нормалізації даних, кластерного розподілу та інтерпретації результатів.
Результати дослідження відображають побудову ефективного алгоритму, здатного групувати часові відрізки за подібністю ончейн-поведінки та виділяти фази акумуляції з урахуванням часової динаміки метрик. Реалізовано архітектуру класифікації, яка не залежить від цінових даних і може функціонувати в реальному часі в складі систем криптоаналітики.
У висновках доведено ефективність запропонованої моделі для виявлення фаз накопичення на основі динаміки структур ончейн-даних. Установлено, що алгоритм здатний забезпечити раннє виявлення змін ринкової поведінки та знизити залежність від традиційних спекулятивних індикаторів.
Перспективи подальших досліджень пов’язані з інтеграцією часових залежностей у кластерну модель, розширенням системи на інші цифрові активи, впровадженням агрегованих індексів накопичення та самонавчальних компонентів з урахуванням макроекономічних і позамережевих впливів.
Ключові слова: кластеризація даних, поведінкові індикатори, криптовалютна аналітика, фазова сегментація, ончейн-моделювання.
Summary. The relevance of the study is determined by the need to create tools for objective identification of digital asset market phases based on the behavioral characteristics of network participants, which are recorded not by price, but by on-chain metrics. In the current environment of growing cryptocurrency market volatility and the insufficient effectiveness of classic technical analysis indicators, there is an increasing demand for algorithms capable of detecting latent market states, in particular the accumulation phase, even before price changes occur.
The purpose of this article is to create an algorithmic model for detecting the accumulation phase in the cryptocurrency market by applying cluster analysis to a set of on-chain indicators, which allows for more accurate and timely assessment of market dynamics for use in investment decision support systems.
The research methodology is based on the use of blockchain network behavioral metrics (Realized Cap HODL Waves, Dormancy, SOPR, Exchange Outflow Volume, Address Balance Distribution) and unsupervised cluster learning algorithms. HDBSCAN was used as the main clustering method, allowing for the adaptive identification of market phases without fixing their number. A procedural diagram was constructed covering the stages of data collection, processing, normalization, cluster distribution, and interpretation of results.
The research results reflect the construction of an effective algorithm capable of grouping time intervals by similarity of on-chain behavior and identifying accumulation phases taking into account the time dynamics of metrics. A classification architecture has been implemented that does not depend on price data and can function in real time as part of cryptanalysis systems.
The conclusions prove the effectiveness of the proposed model for detecting accumulation phases based on the dynamics of on-chain data structures. It has been established that the algorithm is capable of ensuring early detection of changes in market behavior and reducing dependence on traditional speculative indicators.
Prospects for further research are related to the integration of time dependencies into the cluster model, the extension of the system to other digital assets, the introduction of aggregated accumulation indices and self-learning components, taking into account macroeconomic and off-network influences.
Key words: data clustering, behavioral indicators, cryptocurrency analytics, phase segmentation, on-chain modeling.
Постановка проблеми. Ідентифікація фази накопичення на криптовалютному ринку є однією з ключових передумов для прийняття обґрунтованих інвестиційних рішень, формування торгових стратегій та прогнозування подальших цінових коливань. Попри наявність численних технічних індикаторів, що використовуються в традиційному трейдингу, сучасний етап розвитку блокчейн-технологій актуалізує необхідність залучення ончейн (on-chain)-метрик, які відображають поведінку учасників мережі безпосередньо на рівні транзакцій, переміщення активів і зміни балансових структур. Такі показники, як середнє збереження монет, частка довгострокових власників, об’єм транзакцій чи коефіцієнти прибутковості дають змогу виявити накопичення активів великими учасниками (так званими «китами») ще до того, як ці сигнали відображаються в ціновій динаміці.
Однак визначення фази накопичення на основі ончейн-даних є складним завданням через високий рівень варіативності поведінкових моделей, сезонність, а також вплив зовнішніх інформаційних та регуляторних факторів. Це зумовлює потребу у створенні алгоритмів, здатних узагальнювати різноспрямовані параметри в єдину класифікаційну модель, що дозволяє з високою точністю ідентифікувати характерні стани ринку. У цьому контексті кластерний аналіз постає як ефективний інструмент виявлення прихованих закономірностей у великомасштабних масивах ончейн інформації, оскільки дає змогу об’єднати подібні за поведінкою періоди без попереднього маркування даних.
Проблематика ідентифікації фаз ринку на основі кластеризації ончейн метрик перебуває на перетині наукових завдань з аналізу тимчасових рядів, методів навчання без учителя та прикладних потреб ринку цифрових активів. Розроблення алгоритмічних моделей, що інтегрують об’єктивні показники поведінки мережі в процес виявлення накопичувальних структур, має як теоретичне значення для досліджень у сфері криптоекономіки, так і практичну цінність для трейдерів, аналітиків і розробників фінансових інструментів на базі блокчейну.
Аналіз останніх досліджень і публікацій. Аналіз сучасних досліджень щодо розроблення алгоритму ідентифікації фази накопичення з урахуванням кластерного аналізу ончейн метрик дозволяє виокремити чотири основні наукові напрями, які формують методологічне підґрунтя відповідних підходів. Перший напрям стосується вдосконалення кластеризаційних алгоритмів для оброблення динамічних і розподілених даних. Зокрема, в роботі С. Сасірекха (S. Sasirekha) та С. Свамінатан (S. Swamynathan) запропоновано ієрархічний кластер-ланцюговий підхід маршрутизації мобільних агентів у бездротових сенсорних мережах, що забезпечує зниження затримок та енерговитрат під час агрегації великих масивів даних [1]. Розширення подібного підходу на структури блокчейн-транзакцій може стати основою для побудови адаптивних алгоритмів виявлення фаз накопичення. Значний внесок у формалізацію якості кластеризації зробили Ц. Лі (Q. Li), С. Юе (S. Yue), Ю. Ван (Y. Wang), М. Дін (M. Ding) та Й. Лі (J. Li), які запропонували індекс кластерної валідності з урахуванням регуляції внутрішньокластерної відстані, що дозволяє точніше ідентифікувати фазові межі в складних часових вибірках [2]. Подальші дослідження в цьому напрямі доцільно зосередити на адаптації кластерних індексів до нерівномірно дисперсних транзакційних даних із блокчейнів, а також на розробленні метрик для динамічного переоцінювання якості кластерів у реальному часі.
Другий напрям пов’язаний з аналізом топологічних структур у графових моделях для виявлення взаємозв’язків між учасниками ринку. М. Р. Майариф (M. R. Ma’arif) запропонував метод виявлення спільнот у мережах постачання шляхом кластеризації на основі подібності зв’язків, що може бути релевантним для сегментації активностей великих криптогравців [3]. У дослідженні З. Чжан (Z. Zhang), Т. Чжоу (T. Zhou) та Ч. Ксє (Z. Xie) продемонстровано багаторівневу кластеризацію біткоїн-адрес із використанням алгоритму Bitscope, що дозволяє ідентифікувати адреси з накопичувальними ознаками [4]. Поглиблений аналіз топології транзакційної мережі в роботі С. Лю (X. Lv), Ю. Чжун (Y. Zhong) та Ц. Тан (Q. Tan) базувався на поєднанні графових і мультимірних метрик, що надало змогу простежити фази накопичення в просторі часових і структурних показників [5]. У подальших дослідженнях варто зосередитися на формалізації графових індикаторів початку фази накопичення, зокрема через ідентифікацію вузлів із транзитивною активністю, що зростає, та локальних конгломератів з аномальними характеристиками.
Третій напрям досліджень пов’язаний із застосуванням кластеризації в системах логістики та контролю якості з використанням сенсорних даних. У праці Х. Фен (H. Feng), Ц. Чен (J. Chen), В. Чжоу (W. Zhou), В. Рунґсардтонґа (V. Rungsardthong) та С. Чжана (X. Zhang) розроблено модель контролю якості в ланцюгах постачання заморожених продуктів, яка інтегрує знанняорієнтований підхід до оброблення даних із сенсорів із кластеризацією контрольних точок [6]. Подібна методика дає змогу локалізувати критичні відхилення, що за аналогією може бути адаптовано до виявлення фазових зрушень у криптовалютних транзакціях. У дослідженні М. Алтаравнеха (M. Altarawneh) описано гібридну методику виявлення ексудатів, що базується на кластеризації та обробленні контурів із використанням алгоритму Watershed, що демонструє ефективність у задачах високої щільності та структурної складності [7]. Подальші розроблення в цьому напрямі мають охоплювати створення модульних фреймворків для автоматизованого оброблення кластеризованих сигналів у режимі потокової аналітики та виявлення прихованих фазових переходів за допомогою ентропійних індикаторів.
Четвертий напрям наукових пошуків охоплює інтеграцію кластеризації у блокчейн-системи як основу децентралізованого прийняття рішень та оптимізації інформаційних потоків. У дослідженні А. Чонґа (A. Y. L. Chong), Е. Ліма (E. T. Lim), С. Хуа (X. Hua), С. Чжена (S. Zheng) та Ч. Тана (C. W. Tan) проведено порівняльний аналіз бізнес-моделей, заснованих на кластеризованій логіці взаємодії між суб’єктами у блокчейні, зокрема в аспекті управління транзакційними процесами [8]. Д. Лю (D. Liu), Й. Ні (J. Ni), С. Лін (X. Lin) та С. Шен (X. Shen) розробили модель рекламної комунікації в транспортному середовищі з кластеризованим розподілом повідомлень, що базується на геолокаційній структурі, інтегрованій у блокчейн-архітектуру [9]. М. Дебе (M. Debe), К. Салах (K. Salah), М. Рехман (M. H. U. Rehman) та Д. Светіновіч (D. Svetinovic) у рамках репутаційної системи для fog-мереж на основі Ethereum запропонували модель децентралізованого довірчого аналізу, яка використовує локальну кластеризацію вузлів [10]. У статті С. М. Х. Бамака (S. M. H. Bamakan), А. Мотавалі (A. Motavali) та А. Б. Бондарті (A. B. Bondarti) представлено класифікацію консенсус-алгоритмів з урахуванням критеріїв масштабованості та чутливості до розподілу кластерів [11]. Л. Ісмаїл (L. Ismail) та Х. Матервала (H. Materwala) надали систематичний огляд протоколів консенсусу, де одним із ключових параметрів виступає кластерна структура підтвердження транзакцій [12]. У монографії М. Шеня (M. Shen), Л. Чжу (L. Zhu) та К. Сюй (K. Xu) проаналізовано архітектуру безпечного обміну даними у блокчейні з огляду на політику кластеризованого доступу до інформації [13]. У цьому напрямі доцільно продовжити дослідження щодо створення динамічних кластерів доступу на основі поведінкових ончейн-профілів, а також адаптації консенсус-механізмів до асиметричних фаз ринку шляхом інтеграції кластерно-залежної ваги голосу.
Незважаючи на все більшу увагу до використання ончейн-аналітики у вивченні криптовалютного ринку, низка важливих аспектів залишається не досить дослідженою. Зокрема, не сформовано узагальненої класифікації поведінкових метрик у контексті фаз ринкової динаміки, відсутні стабільні підходи до виявлення фаз накопичення без цінових даних, а також не розв’язано проблему адаптації кластерного аналізу до умов змінної структури блокчейн-мережі. Наявні моделі часто ігнорують часову динаміку метрик, не враховують впливу зовнішніх чинників і демонструють чутливість до масштабу вибірки, що ускладнює практичне застосування таких рішень у режимі реального часу.
Запропоноване дослідження спрямовано на заповнення цих прогалин шляхом побудови кластерної моделі, здатної працювати з високовимірними ончейн-даними без потреби в попередньому маркуванні. Обґрунтовано вибір індикаторів і алгоритмів, розроблено послідовну процедуру класифікації фаз ринку, виявлено обмеження застосування кластеризації та запропоновано практичні сценарії впровадження результатів. Таким чином, створено підґрунтя для поглибленого аналізу крипторинкових станів і розширення інструментарію криптоаналітики в умовах поведінкової невизначеності.
Мета і завдання статті. Мета статті полягає в розробленні алгоритму ідентифікації фази накопичення криптовалютного ринку на основі кластерного аналізу ончейн-метрик з метою підвищення точності визначення ринкових станів для підтримки інвестиційних рішень.
Для досягнення цієї мети передбачено розв’язання таких завдань:
- проаналізувати структурні характеристики поведінкових ончейн-метрик та обґрунтувати вибір кластерного підходу для фазової ідентифікації ринку;
- розробити алгоритмічну схему інтеграції кластеризації з урахуванням динаміки ключових індикаторів ринку;
- виявити методологічні обмеження кластерного аналізу та сформулювати рекомендації щодо практичного застосування моделі в системах криптоаналітики.
Виклад основного матеріалу. Інформаційний потенціал ончейн-метрик у контексті вивчення криптовалютного ринку ґрунтується на їх здатності відображати не лише агреговану активність користувачів, а й структуру потоків капіталу, тривалість утримання активів та поведінкові патерни великих власників. На відміну від цінових індикаторів, що формуються вже як реакція на попередні події, ончейн-дані відображають первинну динаміку змін у мережі, яка нерідко слугує випереджувальним сигналом про майбутні ринкові фази. Одним із найважливіших напрямів такого аналізу є дослідження поведінкових характеристик учасників, зокрема в аспекті акумуляції активів, що передує періодам зростання. Для цього доцільно виділити ключові ончейн-метрики, які корелюють із фазою накопичення й можуть бути використані в алгоритмах її ідентифікації (табл. 1).
Таблиця 1
Ключові ончейн-метрики для аналізу фази накопичення
Метрика | Опис | Інтерпретація в контексті накопичення |
Realized Cap HODL Waves | Частка капіталізації залежно від віку монет | Зростання довгострокової частки вказує на акумуляцію |
Exchange Outflow Volume | Обсяг виведення активів із централізованих бірж | Підвищення означає зниження тиску продажу |
Dormancy | Середній вік монет, що переміщуються | Зниження активності старих монет свідчить про утримання |
Address Balance Distribution | Кількість адрес із балансом понад певний поріг | Зростання кількості великих адрес – сигнал дій «китів» |
Spent Output Profit Ratio (SOPR) | Співвідношення прибутковості витрачених монет | Значення нижче 1 – фіксація збитків, типова для фази накопичення |
Джерело: сформовано автором на підставі [4; 5; 8; 9; 10]
Зазначені метрики мають високу практичну цінність для виявлення латентних фаз ринкової акумуляції, які не завжди супроводжуються очевидними ціновими змінами, але характеризуються переорієнтацією поведінки ключових учасників. Зокрема, зростання обсягів виведення активів із централізованих бірж (Exchange Outflow Volume) [14] у поєднанні з підвищенням питомої ваги довгострокових утримувачів (Realized Cap HODL Waves) свідчить про стратегічне накопичення з боку інституційних або досвідчених приватних інвесторів [15]. У таких періодах відбувається перерозподіл монет від дезорієнтованих роздрібних учасників до адрес із великим балансом, що фіксується через Address Balance Distribution [16]. Зниження коефіцієнта SOPR нижче одиниці додатково підтверджує наявність ринку з песимістичними настроями, коли монети витрачаються зі збитком, що історично передує фазі зростання [17]. У сукупності ці індикатори дозволяють побудувати емпірично обґрунтовані моделі для ідентифікації фаз накопичення, які вже інтегруються у функціонал провідних аналітичних платформ, зокрема Glassnode [18], CryptoQuant [19] та Messari [20].
Побудова моделі для ідентифікації фази накопичення на основі ончейн-метрик вимагає застосування кластерного алгоритму, здатного працювати з високовимірними, слабоструктурованими даними без апріорного знання кількості кластерів. Особливістю криптовалютного ринку є нерівномірність, нестабільність щільності розподілу значень індикаторів та наявність перехідних фаз, які не мають чітких меж. У такому контексті методи кластеризації повинні забезпечувати виявлення як стабільних, так і нестійких станів ринку, не потребуючи жорсткої геометричної симетрії чи попередньої розмітки. З огляду на ці вимоги було проаналізовано п’ять провідних алгоритмів кластеризації, що застосовуються в задачах фінансового аналізу (табл. 2).
Таблиця 2
Порівняння кластерних алгоритмів у задачах фазової ідентифікації ринку
Алгоритм | Параметри | Переваги | Недоліки |
K-means | k – число кластерів | Простота, висока швидкість | Необхідність задавати k, нечутливий до шуму |
DBSCAN | ε – радіус, minPts – мін. точок | Виявляє довільні форми, нечутливий до шуму | Важко підібрати параметри для багатовимірних даних |
GMM | Кількість компонент | Імовірнісна класифікація, гнучкість | Чутливість до початкових умов, може перенавчитися |
Hierarchical | Вибір відстані/зв’язку | Побудова ієрархій, не потребує k | Повільність, нестійкість до викидів |
HDBSCAN | Мінімальний розмір кластера | Автоматичне визначення кластерів, стабільність | Високе навантаження, складність реалізації |
Джерело: сформовано автором на підставі [1; 2; 3; 6; 7]
На основі порівняльного аналізу та з урахуванням особливостей ончейн-даних було прийнято рішення використовувати алгоритм HDBSCAN як основний класифікатор у моделі фазової ідентифікації. Цей вибір зумовлено кількома чинниками. По-перше, HDBSCAN не потребує попереднього визначення кількості кластерів, що є критично важливим у ситуації, коли структура ринку змінюється динамічно. По-друге, алгоритм стійкий до викидів і здатний виявляти як чітко виражені фази (наприклад, акумуляція чи розпродаж), так і розмиті перехідні стани, які мають меншу щільність спостережень. По-третє, HDBSCAN дозволяє оцінити ймовірність належності кожного спостереження до кластера, що може бути інтегровано в ризик-менеджмент систем криптовалютної аналітики.
Зокрема, для побудови моделі використовуються такі метрики, як: Realized Cap HODL Waves, SOPR, Dormancy, Exchange Outflow Volume, Large Holder Net Position Change, нормалізовані та знижені до спільного масштабного простору. HDBSCAN забезпечує стійке групування часових відрізків із подібними профілями цих метрик, дозволяючи ідентифікувати фази накопичення як окремі кластери з низькою зовнішньою активністю, високим коефіцієнтом утримання активів та низьким SOPR. Таким чином, обґрунтоване використання HDBSCAN як кластерного ядра моделі забезпечує адаптивність, стійкість до аномалій та можливість практичного застосування моделі в умовах волатильного криптовалютного середовища.
Розроблення процедурної схеми інтеграції кластерного аналізу в алгоритм ідентифікації фази накопичення передбачає формалізацію послідовних етапів оброблення, трансформації та інтерпретації ончейн-метрик у структурований висновок про поточний стан ринку. На відміну від класичних схем технічного аналізу, що ґрунтуються на реактивній інтерпретації ціни, ця схема має прогностичну природу: вона фіксує латентні зміни в поведінці учасників мережі ще до появи цінових сигналів. Її актуальність зумовлена зростанням ролі поведінкової аналітики в криптовалютних екосистемах, а також потребою в автоматизованих інструментах, здатних об’єктивно ідентифікувати приховані фази ринку без людського втручання. Структура алгоритму побудована на логіці поетапного агрегування, нормалізації та кластеризації показників, що відображають динаміку переміщення активів, зміну структури власності, глибину втримання та спекулятивний тиск. Особливістю є включення часової згортки, що дає змогу враховувати не просто моментні значення індикаторів, а їх коротко- та середньострокову траєкторію (рис. 1).
Рис. 1. Процедурна схема ідентифікації фази накопичення на основі кластеризації
Джерело: власна розробка автора
Сформована процедура реалізує повний цикл оброблення ончейн-інформації – від її збору з відкритих джерел до генерації прикладного індикатора фазового стану ринку. На першому етапі здійснюється автоматизоване оновлення вхідних метрик через API-доступи, що забезпечує репрезентативність і оперативність даних. Далі виконується препроцесінг із використанням нормалізації, часової згортки та зменшення розмірності, що мінімізує вплив локального шуму та коливань. Векторизація дозволяє подати кожен часовий інтервал як цілісний мультиіндикаторний профіль, який піддається кластеризації за допомогою алгоритму HDBSCAN. Посткластерний аналіз виконує маркування утворених груп на основі типових шаблонів фаз накопичення, розподілу, нейтральної динаміки чи паніки. Підсумковий сигнал, що генерується алгоритмом, може бути інтегрований у панелі криптоаналітики або використовуватися в автоматизованих стратегіях як незалежний маркер фази ринку. Така схема забезпечує адаптивність до змін у поведінковій структурі мережі та стабільність висновків у середовищі з високою волатильністю.
Попри високу гнучкість кластерного аналізу як інструменту для виявлення прихованих структур у багатовимірних масивах ончейн-даних, його застосування в контексті криптовалютного ринку супроводжується низкою методологічних обмежень, що знижують надійність і узагальнюваність отриманих висновків. Одним із ключових викликів є динамічна змінність топології мережі, зокрема поява нових адрес, перерозподіл ролей між гаманцями та циклічне оновлення пулів транзакцій [4]. Це унеможливлює фіксацію стабільних кластерних конфігурацій у довгостроковому розрізі, адже просторове положення об’єктів у метриці схожості постійно змінюється під впливом поведінкових, технічних і регуляторних факторів [3]. Крім того, навіть мінімальні зміни у структурі вибірки або в межах часових вікон можуть призвести до суттєвої перебудови кластерів, що свідчить про чутливість алгоритму до масштабу аналізу. Таке явище особливо характерне для методів, які не використовують глобальні контури подібності, а формують кластери на основі локальних щільностей, як-от DBSCAN або HDBSCAN [2].
Іншим значущим обмеженням є складність у врахуванні впливу позамережевих чинників, як-от зміни нормативного середовища, великі новинні події або міжринкові арбітражні операції. Ончейн-метрики фіксують лише ті процеси, що відбуваються в межах самої блокчейн-мережі, тому не завжди здатні відобразити тригери, що викликали різкі зміни в активності користувачів [9]. Це призводить до ситуацій, коли однакові кластерні патерни можуть мати різну природу й нести протилежний інвестиційний сенс. Зокрема, різке зростання обсягів переказів із гаманців може одночасно бути ознакою як акумуляції з подальшим виведенням на холодні гаманці, так і розпродажу на тлі новинного шоку – і в кластерному аналізі ці події можуть бути об’єднані в один сегмент [5].
Важливим фактором залишається й обмежена репрезентативність вибірки: алгоритми кластеризації однаково сприймають усі часові інтервали, не розрізняючи макроекономічні контексти, фази ринку чи сезонні цикли [2; 11]. Це ускладнює застосування моделей без попереднього контекстуального маркування або безперервного перенавчання. У результаті кластерні підходи можуть демонструвати високу точність щодо історичних даних, але втрачати релевантність у режимі реального часу.
Розроблений алгоритм ідентифікації фази накопичення на основі кластерного аналізу ончейн-метрик може бути ефективно інтегрований у сучасні системи криптоаналітики як автономний модуль оцінювання ринкової динаміки. Для практичного застосування в аналітичному середовищі рекомендується реалізувати механізм щоденного оновлення кластерної оцінки на основі ковзного вікна спостереження (наприклад, 7 або 14 днів), що дозволяє зафіксувати інерційні зміни у структурі утримання активів, потоках на біржі та ступені прибутковості транзакцій. Алгоритмічний класифікатор повинен виводити ймовірність належності поточного ринкового стану до фази накопичення, а не лише бінарний сигнал, що забезпечує вищу адаптивність до змін ринку і зменшує ризик хибнопозитивних результатів.
З метою підвищення аналітичної інтерпретованості кластерів доцільно візуалізувати динаміку основних індикаторів у межах кожного з виявлених станів та створити контекстноорієнтовану карту фазового простору ринку. Це дозволяє аналітикам спостерігати, як змінюються траєкторії метрик у межах кожного кластера та виявляти характерні сигнали переходу від однієї фази до іншої. У системах автоматизованого трейдингу алгоритм може виступати як фільтр ринкових умов – наприклад, активація довгих стратегій лише за умови підтвердження перебування в кластері акумуляції з високою достовірністю. Також його застосування можливе у сфері ризик-менеджменту: зміна фазового стану ринку може використовуватися як підстава для коригування позицій, перерозподілу активів або підвищення рівня страхування.
Із практичної позиції особливо корисним є впровадження інтерактивного API-доступу до кластерного індикатора, що дозволить зовнішнім системам (наприклад, біржовим платформам, портфельним трекерам чи децентралізованим додаткам) інтегрувати цей інструмент у власну інфраструктуру. Це створює передумови для масштабного застосування кластерної фільтрації фаз не лише в аналітичних дашбордах, а й у рішенні для інституційних користувачів, що потребують точкових ринкових оцінок у реальному часі. У разі розширення алгоритму на мультиактивні системи (Ethereum, Litecoin тощо) можлива побудова агрегованого індексу накопичення, що додатково посилить його прогностичну цінність.
Висновки. У результаті дослідження розроблено та апробовано алгоритм ідентифікації фази накопичення криптовалютного ринку на основі кластерного аналізу ончейн-метрик. Запропонований підхід базується на використанні індикаторів мережевої активності, які відображають реальну поведінку учасників ринку, зокрема Realized Cap HODL Waves, SOPR, Dormancy, Exchange Outflow Volume та Address Balance Distribution. Обґрунтовано доцільність застосування алгоритму HDBSCAN, що забезпечує виявлення структурованих і перехідних фаз без необхідності задавати кількість кластерів та з високою стійкістю до викидів.
Сформована процедурна схема охоплює всі етапи – від збору й оброблення даних до класифікації фаз та генерації сигнального маркера. Модель може бути інтегровано в криптоаналітичні платформи або автоматизовані торгові системи, що підвищує її практичну цінність.
Водночас виявлено методологічні обмеження: чутливість до зміни мережевих структур, нестійкість кластерів за варіації масштабу вибірки, а також складність урахування позамережевих факторів. Це потребує постійного моніторингу й адаптації алгоритму до поточних ринкових умов. Перспективи подальших досліджень пов’язані з інтеграцією часових моделей, гібридизацією з прогнозними алгоритмами та побудовою агрегованих фазових індексів для мультиактивного середовища.
Література
- Sasirekha S., Swamynathan S. Cluster-chain mobile agent routing algorithm for efficient data aggregation in wireless sensor network. Journal of Communications and Networks. 2017. Vol. 19, № 4. P. 392–401. DOI: https://doi.org/10.1109/JCN.2017.000063.
- Li Q., Yue S., Wang Y., Ding M., Li J. A new cluster validity index based on the adjustment of within-cluster distance. IEEE Access. 2020. Vol. 8. P. 202872–202885. DOI: https://doi.org/10.1109/ACCESS.2020.3036074 (date of access: 12.11.2020).
- Ma’arif M.R. A clustering technique for detecting communities in supply chain network. Proceedings of the 6th International Annual Engineering Seminar (InAES). Yogyakarta, Indonesia, 2016. P. 206–211. DOI: https://doi.org/10.1109/INAES.2016.7821935.
- Zhang Z., Zhou T., Xie Z. Bitscope: Scaling bitcoin address de-anonymization using multi-resolution clustering. Proceedings of the 51st Hawaii International Conference on System Sciences. 2018. P. 1–11. URL: https://izgzhen.github.io/bitscope-public/paper.pdf (date of access: 12.11.2020).
- Lv X., Zhong Y., Tan Q. A study of Bitcoin de-anonymization: Graph and multidimensional data analysis. IEEE Fifth International Conference on Data Science in Cyberspace (DSC). 2020. P. 339–345. DOI: https://doi.org/10.1109/DSC50466.2020.00059.
- Feng H., Chen J., Zhou W., Rungsardthong V., Zhang X. Modeling and evaluation on WSN-enabled and knowledge-based HACCP quality control for frozen shellfish cold chain. Food Control. 2019. Vol. 98. P. 348–358. DOI: https://doi.org/10.1016/j.foodcont.2018.11.050.
- Altarawneh M.S. A hybrid method for exudates detection using chain processing by watershed segmentation and K-means clustering. Journal of Theoretical and Applied Information Technology. 2019. Vol. 97, № 3. P. 584–593. URL: https://www.jatit.org/volumes/Vol97No3/7Vol97No3.pdf (date of access: 12.11.2020).
- Chong A.Y.L., Lim E.T., Hua X., Zheng S., Tan C.W. Business on chain: A comparative case study of five blockchain-inspired business models. Journal of the Association for Information Systems. 2019. Vol. 20, № 9. P. 1310–1339. DOI: https://doi.org/10.17705/1jais.00568.
- Liu D., Ni J., Lin X., Shen X. Transparent and accountable vehicular local advertising with practical blockchain designs. IEEE Transactions on Vehicular Technology. 2020. Vol. 69, № 12. P. 15694–15705. DOI: https://doi.org/10.1109/TVT.2020.3032375.
- Debe M., Salah K., Rehman M.H.U., Svetinovic D. IoT public fog nodes reputation system: A decentralized solution using Ethereum blockchain. IEEE Access. 2019. Vol. 7. P. 178082–178093. DOI: https://doi.org/10.1109/ACCESS.2019.2958355.
- Bamakan S.M.H., Motavali A., Bondarti A.B. A survey of blockchain consensus algorithms performance evaluation criteria. Expert Systems with Applications. 2020. Vol. 154. Article ID: 113385. DOI: https://doi.org/10.1016/j.eswa.2020.113385.
- Ismail L., Materwala H. A review of blockchain architecture and consensus protocols: Use cases, challenges, and solutions. Symmetry. 2019. Vol. 11, № 10. Article ID: 1198. DOI: https://doi.org/10.3390/sym11101198.
- Shen M., Zhu L., Xu K. Blockchain: Empowering secure data sharing. Berlin/Heidelberg: Springer, 2020. DOI: https://doi.org/10.1007/978-981-15-5939-6.
- Exchange Outflow Volume. CryptoQuant: website. 2020. URL: https://cryptoquant.com/overview/btc-exchange-outflow (дата звернення: 12.11.2020)
- Realized Cap HODL Waves. Glassnode: website. 2020. URL: https://glassnode.com/metrics/aSOPR (дата звернення: 12.11.2020)
- Bitcoin Address Balance Distribution. Messari: website. 2020. URL: https://messari.io/article/bitcoin-address-distribution 3036074 (date of access: 12.11.2020).
- Spent Output Profit Ratio (SOPR). Glassnode: website. 2020. URL: https://academy.glassnode.com/indicators/sopr 3036074 (date of access: 12.11.2020).
- Glassnode: website. 2020. URL: https://glassnode.com 3036074 (date of access: 12.11.2020).
- CryptoQuant: website. 2020. URL: https://cryptoquant.com (date of access: 12.11.2020)
- Messari: website. 2020. URL: https://messari.io3036074 (date of access: 12.11.2020).
Коментарі закрито.
To comment on the article - you need to download the candidate degree and / or doctor of Science