Что методы кластерного анализа могут рассказать о Bitcoin, Ripple и других криптоактивах. Отчет Binance Research.

Резюме

    • Используя корреляционную матрицу и иерархическую кластеризацию, класс цифровых активов можно разделить на несколько подсегментов.
    • В отношении недельной доходности крупные криптоактивы, такие как Bitcoin и Ethereum, демонстрируют высочайшую корреляцию, при этом Ripple показывает меньший уровень корреляции и является лучшим диверсификатором среди криптоактивов с рыночной капитализацией свыше 3 млрд долларов.
    • Форки Биткойна (Gold и Cash), Ethereum Classic и Litecoin образуют единый кластер, тогда как остальные активы образуют группы на основе следующих эффектов:
      • “Binance-эффект”: Tezos и Dogecoin, два актива, не торгуемых на Binance, образуют один дочерний кластер.
      • Потенциальные географические эффекты, такие как дихотомия между американскими и азиатскими криптоактивами.
      • «Эффект листинга на Coinbase»: некоторые активы, уже включенные в листинг Coinbase либо о них сообщалось, что Coinbase исследует возможность введения их поддержки, по-видимому, принадлежат к аналогичным группам.
      • Конфиденциальные койны (Dash и Monero) формируют единый кластер.
    • С другой стороны кластеризация методом k-средних на основе профиля риск/доходность каждого криптоактива не принесла сколько-нибудь значимых результатов. Одно из возможных объяснений заключается в том, что профили доходности и волатильности не связаны с корреляцией курса активов в течение исследуемого периода.

В предыдущем отчете (англ.) мы использовали для анализа внутренних корреляций крипторынка и наблюдения циклических паттернов метод, охватывающий различные группы активов, и обнаружили, что низкий уровень внутренней корреляции между активами в криптосфере часто бывает обусловлен идиосинкратическими факторами, в дополнение к механизму консенсуса монеты и потенциальному “Binance-эффекту”.

Однако общая корреляция, наблюдаемая на рынке криптоактивов, увеличилась, что может быть связано с ростом объемов стейблкойнов и, следовательно, увеличением количества торговых пар на всех рынках криптоактивов. Это отчет о кластерном анализе, проведенном Binance Research на основе данных о двенадцати торговых месяцах с марта 2018 по март 2019 года, чтобы определить, можно ли определить и, что еще важнее, интерпретировать кластеры криптоактивов методом неконтролируемого обучения.

1. Методология

«Кластерный анализ – это метод, используемый для объединения в группы наборов объектов, имеющих схожие характеристики. Это обычная практика в области статистики, но инвесторы могут использовать метод для построения диверсифицированного портфолио. Активы, характеризующиеся высокой корреляцией доходности, попадают в одну корзину, несколько менее высокой – в другую и т.д., пока каждый актив не будет определен в ту или иную категорию».

(Источник: Investopedia)

1.1 Входные данные

Для 30 криптоактивов с наибольшей рыночной капитализацией, на основе данных CoinMarketCap были получены цены в долларовом эквиваленте.

Стейблкойны исключены из анализа, равно как и любые криптоактивы, обеспеченными другими активами, будь то цифровыми или физическими (включая индексы). Для рыночной капитализации криптоактивов «без обеспечения» было рассчитано 30-дневное скользящее среднее (по состоянию на 31 марта 2019 г.) и на основе полученных значений было выбрано 30 крупнейших активов.

Период сбора данных охватывает полный год с 31 марта 2018 по 31 марта 2019 года.

1.2 Выбор алгоритма

Кластерные алгоритмы – это один из подвидов алгоритмов неконтролируемого обучения. В таблице ниже показаны различия между двумя наиболее распространенными кластерными алгоритмами: методом k-средних и иерархической кластеризацией. Подробнее об этом можно прочитать в этой статье (англ.).

Таблица 1: Сравнение кластеризации методом k-средних и иерархической кластеризации
Метод k-средних Иерархическая кластеризация
Размер набора данных Большие наборы данных Малые наборы данных
Определение количества кластеров Предварительно задано вручную Автоматическое
Секционирование Однократное Многократное
Подход Эвристический Снизу вверх (агломеративный)

Сверху вниз (дивизивный)

1.2.1 Методология иерархической кластеризации

1. Данные были предварительно обработаны с помощью корреляционной матрицы, основанной на недельной доходности в течение 1 года. Таким образом, было получено 52 наблюдения. Эта корреляционная матрица фиксирует меняющиеся взаимодействия нормализованным образом. В результате это упрощает расчеты за счет отсеивания большого количества нерелевантной информации.

2. Состав каждого кластера отражен на дендрограмме: неодиночный кластер связывается с дочерними посредством U-образных перемычек. Высота U-образной перемычки представляет расстояние между ее группами дочерних кластеров, а также кофенетическое расстояние между исходными наблюдениями в двух группах дочерних кластеров.

Используется евклидово расстояние (т.е. L2-расстояние); метод связывания опирается на метод Варда («Ward»), минимизирующий внутрикластерную дисперсию.

1.2.1 Методология кластеризации методом k-средних

  1. Недельная доходность рассчитывалась для 30 активов с наибольшей рыночной капитализацией.
  2. На основе этих значений недельной доходности рассчитывали годовую волатильность и среднегодовую доходность.

    годовая доходность = (1 + средняя недельная доходность)52 -1
    годовая волатильность = стандартное отклонение недельной доходности x √ 52

  3. Данные предварительно обрабатывались с использованием масштабирования признаков (feature scaling), так что каждое значение было нормализовано на основе дисперсии (s) и среднего (µ): Z = (X — μ) / s
  4. В конечном счете анализ строится на трехпроцессной методологии:
    1. Инициализация: k-начальные центроиды генерируются случайным образом.
    2. Назначение: k-кластеры создаются путем сопоставления каждого наблюдения с ближайшим центроидом.
    3. Обновление: центроид кластеров становится новым средним.
      • Второй и третий шаги повторяются до тех пор, пока они не сходятся в решение, которое минимизирует сумму квадратичных ошибок между точками и их соответствующими центроидами.
  5. K-оптимальное количество кластеров выбирается на основе методологии «локтеобразной кривой» (elbow curve), которая выбирает оптимальное значение, минимизирующее расстояние до центроида для каждого центра и минимизирует количество кластеров.

2. Результаты

2.1 Выбор активов

В соответствии с методологией, описанной в разделе 1.1, были отобраны следующие цифровые активы:

Топ-10 отобранных криптоактивов:

Bitcoin (BTC), Ethereum (ETH), Ripple (XRP), Litecoin (LTC), EOS, Bitcoin Cash (BCHABC), Binance Coin (BNB), Stellar (XLM), Tron (TRX), Cardano (ADA)

11-20 из отобранных криптоактивов:

Monero (XMR), IOTA, DASH, Maker (MKR), NEO, Ethereum Classic (ETC), Ontology (ONT), NEM, Tezos (XTZ), ZCash (ZEC)

21-30 из отобранных криптоактивов:

Waves (WAVES), Basic Attention Token (BAT), Dogecoin (DOGE), Bitcoin Gold (BTG), Qtum (QTUM), OmiseGo (OMG), Decred (DCR), Lisk (LSK), ChainLink (LINK), 0x (ZRX)

Классификация криптоактивов: кластерный анализ на основе доходности
10 крупнейших криптоактивов по 30-дневной средней рыночной капитализации (в млрд долл.) по состоянию на 31 марта 2019 г.

Bitcoin, Ethereum и Ripple составляют большую часть общей рыночной капитализации отрасли.

Классификация криптоактивов: кластерный анализ на основе доходности
11–30 крупнейшие криптоактивы по 30-дневной средней рыночной капитализации (в млрд долл.) по состоянию на 31 марта 2019 г.

2.2 Матрица корреляции доходности активов за 52-недельный период

Классификация криптоактивов: кластерный анализ на основе доходности
Матрица корреляции недельной доходности. (Интерактивная версия матрицы доступна в оригинальной статье)

Как сказано в первом разделе, в рамках этого анализа рассматривались топ-30 цифровых активов по 30-дневной средней рыночной капитализации по состоянию на 31 марта 2019 г.

Как уже отмечалось в предыдущих докладах Binance Research:

  • Корреляция среди криптоактивов с высокой рыночной капитализацией чрезвычайно высока.
  • Ethereum и Bitcoin также демонстрировали чрезвычайно высокую (0,872) корреляцию друг с другом.
  • Корреляция между PoW-активами была выше, чем среди не-PoW-активов.
  • Наблюдение потенциального «Binance-эффекта»: Tezos и Dogecoin – единственные два актива, не торгуемые на Binance и показавшие более низкую корреляцию с другими криптоактивами.

Однако было сделано несколько дополнительных наблюдений:

  • Dogecoin (DOGE), Tezos (XTZ) и Ripple (XRP) показали самую низкую корреляцию с другими цифровыми активами в исследуемый период. Примечательно, что в долгосрочной перспективе Ripple демонстрирует меньший уровень корреляции, чем в предыдущем исследовании на основе данных о дневной доходности в течение нескольких трехмесячных периодов.
  • Ripple обнаруживает сильную корреляцию со Stellar (0,73). Хотя изначально Stellar был построен на основе протокола Ripple, его программный код вскоре был выведен в отдельную ветвь и значительно обновлен. На сегодняшний день код Stellar и Ripple уже не основывается на одном общем ядре. И тем не менее, между этими двумя активами по прежнему есть определенное сходство, поскольку оба они направлены на «изменение глобальной индустрии денежных переводов».

2.3 Результаты иерархической кластеризации

Классификация криптоактивов: кластерный анализ на основе доходности
Дендрограмма, основанная на корреляционной матрице (на основе квадратов евклидовых расстояний)

Исходя из приведенной дендрограммы можно сказать, что некоторые кластеры, по-видимому, имеют схожие характеристики, такие как:

  • Сходство по географическому признаку: популярность койнов в определенных странах и местоположение самой команды могут оказывать влияние на кластеры. Например, проекты Qtum (QTUM), Cardano (ADA), NEO и OmiseGo (OMG) базируются в Азии, и большинство держателей их койнов тоже находятся в этом регионе. ICO Cardano было направлено на японских инвесторов, которые выкупили до 95% от общего числа предлагавшихся на ICO койнов. Кроме того, Emurgo (коммерческое подразделение проекта Cardano для поддержки стартапов) базируется в Токио. Аналогичным образом, Ripple (XRP), BAT (Basic Attention Token) или Dogecoin (DOGE) – цифровые активы, большая часть команд и инвесторов которых находятся в Америке.
  • Конфиденциальные койны, такие как DASH и Monero (XMR) принадлежат к одному подкластеру. Stellar (XLM) и NEM являются платежными системами, и в конечном итоге образуют единый кластер.
  • “Эффект листинга на Coinbase”: Ripple (XRP) и Basic Attention Token (BAT) были включены в листинг Coinbase в течение исследуемого периода. Кроме того, в ноябре 2018 г. Coinbase объявила о листинге Zcash (ZEC), а еще через несколько месяцев – о поддержке Stellar (XLM) и Maker (MKR). Эти три цифровых актива также образуют общую подгруппу, что говорит в пользу предположения о том, что, в зависимости от времени листинга на одних и тех же биржах, койны в одних рыночных условиях могут демонстрировать схожие тенденции.
  • Форки блокчейнов и программного кода: Litecoin (LTC), Ethereum Classic (ETC), Bitcoin Cash (BCHABC), Bitcoin Gold (BTG) – все они имеют общую историю с двумя крупнейшими цифровыми активами – Биткойном (BTC) и Эфириумом (ETH) – и неважно, сохранена ли эта история в блокчейне или нет.
    • Хотя Litecoin – не форк Биткойна, его код изначально был скопирован с небольшими изменениями из Github-репозитория Биткойна. Bitcoin Cash и Bitcoin Gold же были образованы путем хард-форка.
    • Напротив, Ethereum Classic и Ethereum имеют общий генезисный блок. Хотя Ethereum Classic по праву можно назвать оригинальной цепочкой, популярность и скорость развития Ethereum на сегодняшний день намного выше.
    • Здесь, Bitcoin Cash относится к одному кластеру с Bitcoin Gold, тогда как Litecoin образует группу с Ethereum Classic.
  • Binance Coin представляет собственный дочерний и родительский кластер первой очереди, находится в родительском кластере второй очереди вместе с EOS, Tron (TRX), Lisk (LSK) и Decred (DCR).
  • Потенциальный “Binance-эффект”: Dogecoin (DOGE) и Tezos (XTZ), единственные два актива из исследуемых, не торгуемые на Binance, каждый из которых является единственным компонентом в своей дочерней группе.
  • “Самая большая рыночная капитализация”: Bitcoin (BTC) и Ethereum (ETH), два крупнейших цифровых актива, принадлежат к одному подкластеру.

Однако в отношении любой из приведенных выше интерпретаций существуют явные ограничения:

  • Время листинга на Coinbase не совпадает. Например поддержка Ripple (XRP) и Basic Attention Token (BAT) была введена с разницей более чем в пять месяцев.
  • Сомнительные соответствия. По фундаментальным признакам между Waves (WAVES), Ontology (ONT) и Tezos (XTZ) мало общего. Согласно методологии, они были объединены в одну группу, поскольку все они демонстрировали более низкую корреляцию с другими активами.
  • IOTA вошла в одну группу с Bitcoin (BTC) и Ethereum (ETH), хотя ее рыночная капитализация не сравнима с лидерами крипторынка. Тем не менее можно, пожалуй, сказать, что:
    • Bitcoin – первый блокчейн 1.0 для цифровых денег
    • Ethereum – первый блокчейн 2.0 с поддержкой смарт-контрактов
    • IOTA можно рассматривать как первый блокчейн 3.0 для «интернета вещей»
  • Если EOS, Tron (TRX) и Lisk (LSK) принадлежат к одному сегменту рынка (“блокчейны с поддержкой смарт-контрактов”), то с Decred (DCR), который определяет себя как “автономная цифровая валюта”, они имеют мало общего.

2.4 Результаты анализа методом k-средних

Классификация криптоактивов: кластерный анализ на основе доходности
Локтеобразная кривая – выбор оптимального количества кластеров

Если отталкиваться от приведенной выше цифры, то оптимальным количеством кластеров представляется что-то около 6, поскольку маржинальное улучшение общей суммы квадратов расстояний внутри кластера при большем количестве кластеров становится чрезвычайно малым.

В результате было выбрано шесть кластеров.

Классификация криптоактивов: кластерный анализ на основе доходности
Профили риск/доходность для первого кластера (A)
Классификация криптоактивов: кластерный анализ на основе доходности
Профили риск/доходность для второго кластера (B)

Кластер B состоит из цифровых активов с высокой волатильностью, но отрицательной средней доходностью в исследуемый период.

Классификация криптоактивов: кластерный анализ на основе доходности
Профили риск/доходность для остальных четырех кластеров (C-F)

Основываясь на традиционных атрибутах риска и доходности, многие криптоактивы имеют одинаковые профили риск/доходность (кластеры B и C). Кластер C составляют активы с чрезвычайно высокой волатильностью, но доходностью в годовом исчислении либо положительной, либо слегка отрицательной (за исключением IOTA).

Кластеры C, D и E состоят из одного цифрового актива, например:

  • Кластер Bitcoin Cash (BCHABC), второго актива по уровню волатильности в группе, но с очень небольшой положительной доходностью. Такой профиль риска объясняется произошедшим в ноябре 2018 года форком Bitcoin Cash, который привел к созданию Bitcoin SV (BSV/BCHSV).
  • Кластеры E и F состоят каждый из одного актива с чрезвычайно высокой доходностью:
    • ChainLink (LINK) формирует кластер E.
    • Ontology (ONT) формирует кластер F. Поскольку недельная доходность Ontology обычно не распределяется (при экстремально высоких положительных значениях), его средняя доходность в годовом исчислении сильно тяготеет к повышению.

В целом, недостаток этого метода заключается в том, что два актива могут принадлежать к одному кластеру без какой-либо корреляции между собой. Точнее, два актива могут показывать отрицательную корреляцию, но при этом обладать в точности одинаковым профилем риск/доходность, в результате чего они относятся к одному кластеру.

В будущем этот подход следует расширить, так, чтобы учитывать также следующие характеристики:

  • Рыночная капитализация
  • Торговый объем
  • Коэффициент оборачиваемости

Метрики самого блокчейна, такие как скорость хеширования, количество активных адресов, ончейн-транзакций или активных узлов, тоже можно использовать в качестве входных данных для кластерного анализа, чтобы выяснить, что лежит в основе динамики, демонстрируемой криптоактивами.

3. Заключение

Кластерный анализ представляет собой неконтролируемый метод обучения, который обеспечивает гибкость в классификации объектов в группах без привнесения свойственной человеку предвзятости. Для цифровых активов практическое применение кластерного анализа не было подробно изучено и этот отчет представляет собой одну из первых попыток классифицировать криптоактивы неконтролируемым методом.

Иерархический кластерный анализ выявил потенциальные группы криптоактивов, основанные на таких характеристиках, как функция активов (например, конфиденциальные токены), история блокчейна (например, форки Биткойна) или потенциальная дихотомия между криптоактивами азиатского и американского происхождения. Наконец, потенциальное существование «Binance-эффекта» тоже вносит в кластеризацию свой вклад, равно как и более новое явление, влияние новостей, связанных с Coinbase (например Ripple или Basic Attention Token).

Притом что некоторые из полученных результатов пересекаются с принятыми в отрасли практиками фундаментального анализа активов, сложность получения достоверных данных может удерживать инвесторов от проведения тщательного анализа в этом направлении. Для сравнения, традиционные рынки акций предлагают множество метрик (например, коэффициент цена/доходы, оборот, рентабельность капитала), которые постоянно используются в исследовательских отчетах.

Дополнительный кластерный анализ индустрии цифровых активов может быть выполнен с различных перспектив, а дальнейшее исследование различных сегментов крипторынка по признаку рыночной капитализации (например, активы со средней и малой рыночной капитализацией) с альтернативными входными данными, такими как скорость хеширования или количество ончейн-транзакций, поможет составить более полную картину рынка криптоактивов в целом.

Подписывайтесь на BitNovosti в Telegram!
Делитесь вашим мнением об этой статье в комментариях ниже.

Источник

My Newsletter

Sign Up For Updates & Newsletters