QUICK REVIEW

[논문 리뷰] Reality Check for Tor Website Fingerprinting in the Open World

Mohammadhamed Shadbeh, Khashayar Khajavi|arXiv (Cornell University)|2026. 03. 08.

Internet Traffic Analysis and Secure E-voting인용 수 0

한 줄 요약

이 논문은 실제 Tor 오픈 월드 트래픽에서 수호자-대적 관점으로 WF를 재평가하여, Conflux 트래픽-분할을 포함한 현실 조건에서 강한 WF 효과성과 견고성을 보여준다.

ABSTRACT

Website fingerprinting (WF) attacks on Tor can infer user destinations from encrypted traffic metadata. However, their real-world effectiveness remains debated due to laboratory settings that fail to capture network fluctuations, evaluate noise, and create a representative open world. In this work, we re-examine WF from a guard-relay vantage point using a novel, privacy-preserving methodology that builds an open-world background from real, unlabeled Tor traffic paired with synthetic monitored traces. Using this methodology, we collect a large-scale dataset of over 800,000 traces. We then benchmark state-of-the-art WF attacks under a cross-network setting and show that WF remains highly effective against real Tor open-world traffic: the best-performing attack achieves 0.956 precision and 0.922 recall at a 9% base rate. We further present results that demonstrate robustness to small training sets, network jitter, and concept drift. Moreover, we show that timing-independent classifiers are significantly more robust to network variability than others. Finally, we provide the first systematic study of Tor's Conflux traffic-splitting, where we show that a guard node with a latency advantage can maintain high attack effectiveness even when traffic is split.

연구 동기 및 목표

실험실 환경을 넘어 오픈 월드에서 수호자-대적 관점으로 현실적인 WF 평가를 고무한다.
실제 비감시 트래픽과 합성 모니터링 트레이스를 짝지어 프라이버시를 보호하는 실제 오픈 월드 배경을 구축한다.
교차 네트워크 조건하에서 최첨단 WF 공격을 벤치마크하고 네트워크 가변성, 타이밍 특성, 개념 드리프트에 대한 강건성을 분석한다.
수호자 관찰 하에서 Tor Conflux 트래픽-분할 및 WF 효과에 대한 영향을 조사한다.

제안 방법

실제 오픈 월드 트래픽과 합성 모니터링 트레이스를 사용하여 프라이버시-보호 수호자-대적 방법론을 도입하고 800k 트레이스에 걸친 오픈 월드 데이터셋을 구축한다.
ground-truth 라벨을 수집하지 않으면서 셀당 메타데이터를 로깅하고 데이터를 정제하기 위해 Tor 가드 릴레이를 계측한다.
정확한 페이지 수준의 ground-truth 레이블을 포함하는 합성 모니터링 트레이스를 사용하여 WF 분류기를 학습하고 테스트를 위해 실제 비모니터링 트레이스를 사용하여 평가한다.
최첨단 WF 공격의 교차 네트워크 성능을 평가하고 네트워크 지터 및 개념 드리프트에 대한 강건성에 중점을 둔다.
다양한 지연 이점에서 수호자-관찰자 WF 효과를 체계적으로 평가하기 위해 Conflux 트래픽-분할을 연구한다.

실험 결과

연구 질문

RQ1수호자 관점에서 현실 Tor 오픈 월드 트래픽에 대한 현대 WF 공격은 얼마나 효과적인가?
RQ2합성 모니터링 트레이스가 실제 비모니터링 트래픽과 결합되어 교차 네트워크 조건에서 현실적이고 강건한 WF 평가를 제공하는가?
RQ3Conflux 트래픽-분할이 수호자-대적이 웹사이트를 지문화하는 능력에 어떤 영향을 미치는가?
RQ4타이밍 의존적 대 타이밍 의존적이지 않은 학습 설정이 네트워크 가변성에 어떤 강건성을 제공하는가?

주요 결과

교차 네트워크 조건에서 최적의 공격은 9% 기본 비율에서 0.956 정밀도 및 0.922 재현율을 달성한다.
pi10 0.980 및 재현율 0.968을 산출하는 풀링된 학습/테스트를 보인다.
작은 학습 집합, 네트워크 지터 및 개념 드리프트에 대한 강건성이 입증되었으며, 타이밍 비의존적 분류기가 가변성에 더 큰 강건성을 보인다.
수호자가 지연 이점을 가지면 Conflux 트래픽-분할로 인한 영향이 완화될 수 있으며, FPR = 0.5%에서 재현율이 0.522에서 0.881로 증가한다.
이 연구는 수호자-대적 WF 맥락에서 Tor의 Conflux 트래픽-분할에 대한 최초의 체계적 연구를 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.