QUICK REVIEW

[논문 리뷰] Padding Ain't Enough: Assessing the Privacy Guarantees of Encrypted DNS

Jonas Bushart, Christian Rossow|arXiv (Cornell University)|2019. 07. 02.

Internet Traffic Analysis and Secure E-voting참고 문헌 36인용 수 24

한 줄 요약

이 논문은 표준 메시지 패딩을 사용하는 DNS over TLS (DoT) 및 DNS over HTTPS (DoH)가 여전히 트래픽 분석 공격에 취약하다고 보여준다. 암호화되고 패딩된 DNS 쿼리의 시퀀스—크기 및 시간 패턴을 모두 분석함으로써, 저자들은 악성 공격자가 사용자를 디안온라이니마이즈하고 방문한 웹사이트를 높은 정확도로 식별할 수 있음을 입증한다. 이는 현재 패딩 전략의 프라이버시 보장을 약화시킨다.

ABSTRACT

DNS over TLS (DoT) and DNS over HTTPS (DoH) encrypt DNS to guard user privacy by hiding DNS resolutions from passive adversaries. Yet, past attacks have shown that encrypted DNS is still sensitive to traffic analysis. As a consequence, RFC 8467 proposes to pad messages prior to encryption, which heavily reduces the characteristics of encrypted traffic. In this paper, we show that padding alone is insufficient to counter DNS traffic analysis. We propose a novel traffic analysis method that combines size and timing information to infer the websites a user visits purely based on encrypted and padded DNS traces. To this end, we model DNS sequences that capture the complexity of websites that usually trigger dozens of DNS resolutions instead of just a single DNS transaction. A closed world evaluation based on the Alexa top-10k websites reveals that attackers can deanonymize at least half of the test traces in 80.2% of all websites, and even correctly label all traces for 32.0% of the websites. Our findings undermine the privacy goals of state-of-the-art message padding strategies in DoT/DoH. We conclude by showing that successful mitigations to such attacks have to remove the entropy of inter-arrival timings between query responses.

연구 동기 및 목표

DoT/DoH에서 메시지 패딩이 트래픽 분석 공격을 방지하는 데 충분한지 조사하기 위해.
암호화된 DNS 프로토콜에서 현재 패딩 전략의 프라이버시 보장을 평가하기 위해.
DNS 트래픽의 시퀀스 수준 분석(크기 및 시간 포함)이 사용자를 디안온라이니마이즈하는 데 얼마나 효과적인지 평가하기 위해.
방문한 웹사이트를 추론하기 위해 DNS 트랜잭션 시퀀스를 사용하는 k-NN 분류기를 개발하고 평가하기 위해.
기존의 대응 조치가 암호화된 DNS에서 고도의 트래픽 분석에 대해 충분하지 않음을 입증하기 위해.

제안 방법

저자들은 웹사이트에 의해 유도된 DNS 해석 시퀀스를 모델링하여 쿼리 간의 메시지 크기와 간격 시간을 모두 캡처한다.
관측된 DNS 시퀀스를 알려진 웹사이트 프로파일과 매칭하기 위해 k-Nearest Neighbors (k-NN) 분류기를 제안한다.
분류기는 DNS 메시지 크기 분포와 시간 패턴에서 유도된 통계적 특징을 사용한다.
클래스피어링을 위해 Alexa top-10k 웹사이트의 DNS 트레이스를 사용하여 폐쇄 세계 평가를 수행한다.
완전한 시퀀스와 부분 캐시된 시퀀스를 모두 평가하여 분류기의 강건성을 평가한다.
개방 세계 평가를 통해 가짜 양성률을 측정하여, 현실적인 위협 모델 하에서도 공격이 여전히 효과적임을 보였다.

실험 결과

연구 질문

RQ1악성 공격자가 암호화되고 패딩된 DNS 쿼리의 크기 및 시간만을 분석하여 사용자를 디안온라이니마이즈할 수 있는가?
RQ2단일 트랜잭션 분석에 비해 DNS 트랜잭션의 시퀀스 수준 분석이 웹사이트 지문 추론에 얼마나 향상되는가?
RQ3k-NN 분류기는 암호화되고 패딩된 DNS 시퀀스를 기반으로 웹사이트를 식별하는 데 얼마나 효과적인가?
RQ4DNS 캐싱은 이러한 트래픽 분석 공격의 성공률에 어떤 영향을 미치는가?
RQ5개방 세계 설정에서 가짜 양성률을 제한하면서도 높은 정확도를 유지할 수 있는가?

주요 결과

악성 공격자는 Alexa top-10k 목록의 10개 웹사이트 중 5개에 대해 암호화되고 패딩된 DNS 시퀀스만을 사용하여 최소 80.2%의 테스트 트레이스를 디안온라이니마이즈할 수 있다.
분류기는 32.0%의 웹사이트에 대해 모든 트레이스를 정확하게 레이블링하여 일부 사례에서는 높은 정확도를 보였다.
캐시된 DNS 레코드를 제외하더라도, 훈련 데이터에 부분 캐시된 시퀀스가 포함되어 있으면 분류기는 높은 정확도를 유지한다.
가짜 양성률을 10%로 제한하면서도 진짜 양성률을 40%로 유지할 수 있어 공격이 확장 가능하고 실용적임을 보였다.
메시지 크기만으로는 부족하고, DNS 쿼리 간의 시간 정보가 더 높은 엔트로피를 제공하며 분류 성공에 필수적이다.
결과적으로 DoT/DoH에서 현재의 패딩 전략이 트래픽 분석을 방지하는 데 부족하며, 이는 그들의 프라이버시 보장을 약화시킨다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.