[논문 리뷰] Bitcoin Transaction Graph Analysis
이 논문은 웹 스크래핑을 통해 수집한 포럼 데이터와 거래 그래프 분석을 활용해 비트코인 사용자의 공개 키를 실제 신원과 연결함으로써 비트코인 사용자를 탈익명화하는 프레임워크를 제안한다. 블록체인에 실제 세계의 신원을 주석 처리하고 페이지랭크와 같은 그래프 알고리즘을 적용함으로써 고도로 활동적인 노드를 식별하며, 시스템은 FBI의 실버로드 자산 압수 사건을 탐지하고, 포럼 사용자를 불법 또는 고도로 주목받는 실체인 사토시디스, 월스트리트저널 등과 연결함으로써 자신의 접근 방식을 검증한다.
Bitcoins have recently become an increasingly popular cryptocurrency through which users trade electronically and more anonymously than via traditional electronic transfers. Bitcoin's design keeps all transactions in a public ledger. The sender and receiver for each transaction are identified only by cryptographic public-key ids. This leads to a common misconception that it inherently provides anonymous use. While Bitcoin's presumed anonymity offers new avenues for commerce, several recent studies raise user-privacy concerns. We explore the level of anonymity in the Bitcoin system. Our approach is two-fold: (i) We annotate the public transaction graph by linking bitcoin public keys to "real" people - either definitively or statistically. (ii) We run the annotated graph through our graph-analysis framework to find and summarize activity of both known and unknown users.
연구 동기 및 목표
- 암호학적 가명성에도 불구하고 비트코인의 공개 거래 레지스트리가 사용자 익명성에 얼마나 침해하는지를 조사하는 것.
- 공개 소스에서의 모호한 거래 정보를 활용해 실제 신원(예: 포럼 사용자명)을 비트코인 공개 키와 연결하는 시스템을 개발하는 것.
- 수정된 거래 그래프를 분석하여 사용자 활동을 탐지하고 군집화하며, 특히 영향력이 큰 또는 의심스러운 행동을 식별하는 것.
- 실제로 알려진 고도로 주목받는 거래, 예를 들어 FBI의 실버로드 자산 압수 사건을 식별함으로써 프레임워크의 효과성을 검증하는 것.
- 사토시디스나 월스트리트저널과 같은 주요 실체와의 연결을 추적함으로써 비트코인의 프라이버시 영향을 탐색하는 것.
제안 방법
- 비트코인 주소를 공개 포럼(예: bitcointalk.org)에서 스크래핑하여 Scrapy를 사용하고, 정규표현식 기반 추출을 통해 비트코인 주소 형식에 부합하는 문자열을 추출하는 것.
- 비트코인의 내장 캐크섬을 사용해 추출된 주소의 정당성을 검증한 후 주석 처리하는 것.
- 시간과 금액 추정치를 기반으로 확률적 후보 매칭을 통해 모호한 거래 보고(예: '정오에 100달러를 보냈습니다')를 실제 블록체인 거래에 매칭하는 것.
- Armory와 LevelDB 색인을 사용해 전체 비트코인 블록체인을 파싱하여 거래 데이터를 추출하고 거래 그래프를 구축하는 것.
- 다중 입력 거래에 대한 전이 폐쇄를 통해 사용자 그래프를 구축하고, 공개 키를 실제 사용자/실체와 연결하며, 페이지랭크를 적용해 영향력 있는 노드를 식별하는 것.
- 페이지랭크를 사용해 거래 네트워크 내에서 중심성과 중요도에 따라 사용자를 순위 매겨 높은 순위의 노드를 대상으로 조사할 수 있도록 하는 것.
실험 결과
연구 질문
- RQ1공개 거래 데이터와 포럼에서 확보한 외부 정보를 활용해 비트코인 사용자를 얼마나 효과적으로 탈익명화할 수 있는가?
- RQ2모호한 거래 보고(예: 약간의 시간과 금액)가 실제로 블록체인 거래에 얼마나 정확하게 매칭될 수 있는가?
- RQ3사전 지식 없이도 페이지랭크와 같은 그래프 분석 기법이 비트코인 네트워크 내에서 영향력 있는 또는 의심스러운 사용자를 식별할 수 있는가?
- RQ4기본적으로 알려진 포럼 사용자와 실버로드, 사토시디스, 월스트리트저널과 같은 주요 실체 간의 연결 고리는 무엇인가?
- RQ5거래 그래프 분석을 통해 FBI의 실버로드 자산 압수 사건과 같은 실제 세계의 사건을 얼마나 잘 탐지할 수 있는가?
주요 결과
- 2013년 10월 25일, 시스템은 FBI의 공개 주소가 높은 페이지랭크 노드로 식별되었으며, 이는 실버로드에서 압수된 324 BTC에 해당하는 알려진 압수 사건과 일치했다.
- 이 프레임워크는 단일 중개자를 통해 여러 비트코인 포럼 사용자를 실버로드 네트워크와 연결함으로써 간접적인 탈익명화의 가능성을 입증했다.
- 포럼 사용자와 사토시디스 사이에 직접 거래가 발견되었으며, 이들 도박 사이트의 거래 중 48퍼센트가 스크래핑된 포럼 데이터에서 유래한 사용자로부터 유래한 것으로 추적되었다.
- 시스템은 포럼 사용자에서 월스트리트저널로의 거래를 탐지하여, 이 조직과의 지원 또는 상호작용 가능성을 시사했다.
- 2013년 10월 25일 기준 사용자 그래프에는 54,941명의 사용자와 89,806개의 간선이 포함되어 있었으며, 여러 식별 가능한 커뮤니티, 단일 실체, 고빈도 거래가 뚜렷하게 드러났다.
- 분석 결과, 비트코인의 공개 레지스트리에 외부 데이터를 결합하면 사용자가 암호학적 가명을 사용하더라도 익명성이 상당히 약화됨을 확인했다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.