[论文解读] Characterizing and Detecting Money Laundering Activities on the Bitcoin Network
本文分析比特币交易图,利用图特征和图嵌入来区分洗钱交易与常规交易,并展示基于 node2vec 的分类器在二分类中取得高准确度且对 2.5 年内具有鲁棒性,同时探索未知洗钱服务的发现。
Bitcoin is by far the most popular crypto-currency solution enabling peer-to-peer payments. Despite some studies highlighting the network does not provide full anonymity, it is still being heavily used for a wide variety of dubious financial activities such as money laundering, ponzi schemes, and ransom-ware payments. In this paper, we explore the landscape of potential money laundering activities occurring across the Bitcoin network. Using data collected over three years, we create transaction graphs and provide an in-depth analysis on various graph characteristics to differentiate money laundering transactions from regular transactions. We found that the main difference between laundering and regular transactions lies in their output values and neighbourhood information. Then, we propose and evaluate a set of classifiers based on four types of graph features: immediate neighbours, curated features, deepwalk embeddings, and node2vec embeddings to classify money laundering and regular transactions. Results show that the node2vec-based classifier outperforms other classifiers in binary classification reaching an average accuracy of 92.29% and an F1-measure of 0.93 and high robustness over a 2.5-year time span. Finally, we demonstrate how effective our classifiers are in discovering unknown laundering services. The classifier performance dropped compared to binary classification, however, the prediction can be improved with simple ensemble techniques for some services.
研究动机与目标
- 在三年期间表征洗钱交易与常规比特币交易的图性质。
- 评估基于特征的分类器与基于嵌入的分类器在洗钱检测中的效果。
- 评估分类器随时间的鲁棒性以及在发现未知洗钱服务中的表现。
提出的方法
- 使用基于 UTXO 的交易,从三年的数据(2014–2017)构建比特币交易图。
- 提取 14 个基础与网络特征;进行特征重要性分析以识别区分度高的特征。
- 应用基于:直接邻居、精心设计的特征、DeepWalk 嵌入和 Node2Vec 嵌入的四种分类器;使用 Adaboost,以决策树作为基学习器。
- 在连续的 5 周内进行训练/测试;用准确率和 F1 值进行评估;测试集成方法(OR/AND)。
- 使用基于随机游走的图表示(DeepWalk/Node2Vec),并给定超参数在分类前获得节点嵌入(例如 100 次游走、长度 100、嵌入维度 25;Node2Vec 参数 p=2, q=0.5)。
- 通过对 2014–2017 年的随机周应用 node2vec 分类器来评估随时间的一致性。
实验结果
研究问题
- RQ1是否可以基于图结构特征和数值来区分洗钱交易与常规交易?
- RQ2基于随机游走的图嵌入(DeepWalk/Node2Vec)是否在洗钱检测中优于人工设计的特征?
- RQ3分类器在时间上以及在未知洗钱服务之间的鲁棒性如何?
主要发现
- 洗钱交易的入度/出度比值更高,输出总和更为均匀,且弱连接分量数量略少于常规交易。
- 单独的人为提取特征在区分上能力有限(例如 65.3% 准确度,F1 0.45)。
- DeepWalk 和 Node2Vec 嵌入在二元分类中优于手工特征(DeepWalk: 准确度 91.72%,F1 0.94;Node2Vec: 准确度 92.05%,F1 0.94)。
- 集成方法(OR)略微提升性能(92.74% 准确度,F1 0.95),而 AND 集成表现不佳(21.47% 准确度,F1 0.02)。
- Node2vec 分类器在 2.5 年跨度内表现鲁棒(平均 92.29% 准确度,F1 0.93)。
- 在预测新洗钱实例时,对未知服务的表现下降,但 node2vec 在 HelixMixer 上可达到较高准确度(该服务的准确度 95.2%,F1 0.30)。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。