Skip to main content
QUICK REVIEW

[논문 리뷰] Anti-Money Laundering in Bitcoin: Experimenting with Graph Convolutional Networks for Financial Forensics

Mark Weber, Giacomo Domeniconi|arXiv (Cornell University)|2019. 07. 31.
Crime, Illicit Activities, and Governance인용 수 167
한 줄 요약

이 논문은 Elliptic Data Set을 소개하고, 대규모 라벨링된 Bitcoin 트랜잭션 그래프를 제시하며, illicit transaction detection에 대해 전통 ML 방법과 Graph Convolutional Networks (GCNs)을 평가하고 RF의 강력한 성능과 암호화폐 AML에서 그래프 기반 접근의 가능성을 강조한다.

ABSTRACT

Anti-money laundering (AML) regulations play a critical role in safeguarding financial systems, but bear high costs for institutions and drive financial exclusion for those on the socioeconomic and international margins. The advent of cryptocurrency has introduced an intriguing paradox: pseudonymity allows criminals to hide in plain sight, but open data gives more power to investigators and enables the crowdsourcing of forensic analysis. Meanwhile advances in learning algorithms show great promise for the AML toolkit. In this workshop tutorial, we motivate the opportunity to reconcile the cause of safety with that of financial inclusion. We contribute the Elliptic Data Set, a time series graph of over 200K Bitcoin transactions (nodes), 234K directed payment flows (edges), and 166 node features, including ones based on non-public data; to our knowledge, this is the largest labelled transaction data set publicly available in any cryptocurrency. We share results from a binary classification task predicting illicit transactions using variations of Logistic Regression (LR), Random Forest (RF), Multilayer Perceptrons (MLP), and Graph Convolutional Networks (GCN), with GCN being of special interest as an emergent new method for capturing relational information. The results show the superiority of Random Forest (RF), but also invite algorithmic work to combine the respective powers of RF and graph methods. Lastly, we consider visualization for analysis and explainability, which is difficult given the size and dynamism of real-world transaction graphs, and we offer a simple prototype capable of navigating the graph and observing model performance on illicit activity over time. With this tutorial and data set, we hope to a) invite feedback in support of our ongoing inquiry, and b) inspire others to work on this societally important challenge.

연구 동기 및 목표

  • 암호화폐 맥락에서 anti-money laundering 안전성과 금융 포용성 사이의 균형을 모티브로 한다.
  • AML 연구를 위한 크고 공개적으로 이용 가능한 라벨링된 Bitcoin 트랜잭션 데이터셋을 제공한다.
  • 전통적인 ML 기초 모델과 그래프 기반 방법을 평가하여 Bitcoin 데이터의 불법 거래를 탐지한다.
  • 분석가의 금융 포렌식 분석을 돕기 위한 시각화 및 설명 가능성 도구를 논의한다.

제안 방법

  • 트랜잭션이 노드이고 BTC 흐름이 간선인 시각 타임스탬프가 부여된 directed 그래프를 구성한다.
  • 개시 주체의 카테고리 및 공개 데이터를 기반으로 노드를 illicit 또는 licit로 주석화한다.
  • 각 노드를 166개의 특징(로컬 및 한 홉 집계 특징)으로 표현한다.
  • 94개의 로컬 특징과 선택적 전체 166 특징을 사용하여 고전 ML 모델(Logistic Regression, Random Forest, MLP)을 적용한다.
  • 그래프 구조를 활용하기 위해 2-layer 아키텍처와 skip 변형(Skip-GCN)을 갖춘 Graph Convolutional Networks (GCN)을 적용한다.
  • 시간 단계 간의 다이나믹스를 캡처하기 위해 EvolveGCN으로 시간적 모델링을 탐구한다.

실험 결과

연구 질문

  • RQ1그래프 구조가 Feature 기반 모델을 넘어서 Elliptic Data Set에서 불법 거래 탐지에 도움이 되는가?
  • RQ2GCN 기반 접근법은 불균형한 조건에서 불법 클래스의 정밀도, 재현율, F1에 대해 전통 ML 방법과 어떻게 비교되는가?
  • RQ3그래프 임베딩으로 노드 특징을 보강하는 것이 분류 성능에 어떤 영향을 미치는가?
  • RQ4시간적 모델링(EvolveGCN)이 이 데이터셋에서 정적 GCN에 비해 의미 있는 이점을 제공하는가?

주요 결과

  • Random Forest with all features (AF) achieves the highest performance among baseline models in Table 1.
  • GCN and Skip-GCN outperform Logistic Regression, demonstrating the value of graph information for AML in this data.
  • Using all features (AF) or local features (LF) with graph embeddings improves performance, indicating graph information benefits representation.
  • Temporal model EvolveGCN consistently outperforms non-temporal GCN in illicit detection, though gains are context-dependent.
  • Graph-driven visualization prototype (Chronograph) supports explainability and analysis of illicit patterns over time.
  • The dataset contains 203,769 nodes and 234,355 edges with 2% illicit and 21% licit labelled nodes, highlighting class imbalance and scalability considerations.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.