Skip to main content
QUICK REVIEW

[論文レビュー] Characterizing and Detecting Money Laundering Activities on the Bitcoin Network

Yining Hu, Suranga Seneviratne|arXiv (Cornell University)|Dec 27, 2019
Crime, Illicit Activities, and Governance参考文献 24被引用数 46
ひとこと要約

本論文はBitcoin取引グラフを分析し、グラフ特徴量とグラフ埋め込みを用いてマネー・ローンダリングと通常の取引を識別し、node2vecベースの分類器が高い二値分類精度と2.5 yearsにわたる頑健性を示すとともに、未知のマネーロンダリングサービスの発見を探索する。

ABSTRACT

Bitcoin is by far the most popular crypto-currency solution enabling peer-to-peer payments. Despite some studies highlighting the network does not provide full anonymity, it is still being heavily used for a wide variety of dubious financial activities such as money laundering, ponzi schemes, and ransom-ware payments. In this paper, we explore the landscape of potential money laundering activities occurring across the Bitcoin network. Using data collected over three years, we create transaction graphs and provide an in-depth analysis on various graph characteristics to differentiate money laundering transactions from regular transactions. We found that the main difference between laundering and regular transactions lies in their output values and neighbourhood information. Then, we propose and evaluate a set of classifiers based on four types of graph features: immediate neighbours, curated features, deepwalk embeddings, and node2vec embeddings to classify money laundering and regular transactions. Results show that the node2vec-based classifier outperforms other classifiers in binary classification reaching an average accuracy of 92.29% and an F1-measure of 0.93 and high robustness over a 2.5-year time span. Finally, we demonstrate how effective our classifiers are in discovering unknown laundering services. The classifier performance dropped compared to binary classification, however, the prediction can be improved with simple ensemble techniques for some services.

研究の動機と目的

  • マネーロンダリングと通常のBitcoin取引のグラフ特性を、3-year periodにわたって特徴付ける。
  • マネーロンダリング検出における特徴量ベースと埋め込みベースの分類器を評価する。
  • 時間経過と未知のマネーロンダリングサービスの発見における分類器の頑健性を評価する。

提案手法

  • UTXOベースの取引を用いて、3年間のデータ(2014–2017)からBitcoin取引グラフを構築する。
  • 14個の基本的およびネットワーク特徴を抽出し、識別力の高い特徴を特定するために特徴量重要度分析を実施する。
  • 直近隣居基盤、精査された特徴、DeepWalk埋め込み、および node2vec埋め込みに基づく4つの分類器を適用する。ベース学習器として決定木を用いたAdaboostを使用する。
  • 5連続週にわたる訓練/テストを実施;精度とF1指標で評価;OR/ANDなどのアンサンブルアプローチをテストする。
  • 指定されたハイパーパラメータを用いて、乱択ウォークに基づくグラフ表現(deepwalk/node2vec)を用いてノード埋め込みを得る(例: 100回のウォーク、長さ100、埋め込み次元25、node2vecのパラメータ p=2, q=0.5)を分類前に適用。
  • 2014–2017のランダムな週に対してnode2vec分類器を適用して時間的一貫性を評価する。

実験結果

リサーチクエスチョン

  • RQ1マネーローダリング取引は、グラフの構造的特徴と値に基づいて、通常の取引と区別できるか?
  • RQ2乱走行ウォークベースのグラフ埋込み(deepwalk/node2vec)は、マネーロンダリング検出において手動で設計された特徴を上回るか?
  • RQ3分類器は時間と未知のマネーロンダリングサービスに対してどれくらい頑健か?

主な発見

ClassifierAccuracy (%)F1-measure
Neighbourhood28.460.09
Manually extracted features65.340.45
Deepwalk91.720.94
Node2vec92.050.94
? OR ensemble92.740.95
? AND ensemble21.470.02
  • マネーロンダリング取引は、通常取引よりも高い入次数/出次数比、より均一な出力総和、そして弱連結成分がやや少ない。
  • 手動で抽出した特徴だけでは識別性は限られる(例: 65.3%の精度、F1 0.45)。
  • Deepwalkおよびnode2vecの埋め込みは、二値分類で手動特徴より優れている(Deepwalk: 91.72%の精度、F1 0.94; Node2vec: 92.05%の精度、F1 0.94)。
  • Ensembleアプローチ(OR)は性能をわずかに向上させる(92.74%の精度、F1 0.95)一方ANDアンサンブルは不調(21.47%の精度、F1 0.02)。
  • Node2vec分類器は2.5年にわたる期間で頑健な性能を示す(平均92.29%の精度、F1 0.93)。
  • 新たなマネーロンダリング事例を予測する際、未知サービスでは性能が低下するが、HelixMixerでは高い精度に到達できる(95.2%の精度、F1 0.30)。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。