QUICK REVIEW

[论文解读] Padding Ain't Enough: Assessing the Privacy Guarantees of Encrypted DNS

Jonas Bushart, Christian Rossow|arXiv (Cornell University)|Jul 2, 2019

Internet Traffic Analysis and Secure E-voting参考文献 36被引用 24

一句话总结

本文表明，使用标准消息填充的DNS over TLS（DoT）和DNS over HTTPS（DoH）仍然容易受到流量分析攻击。通过分析加密且已填充的DNS查询序列——包括大小和时间模式——作者证明，攻击者可以以高准确度实现用户去匿名化并识别访问的网站，从而破坏当前填充实践的隐私保障。

ABSTRACT

DNS over TLS (DoT) and DNS over HTTPS (DoH) encrypt DNS to guard user privacy by hiding DNS resolutions from passive adversaries. Yet, past attacks have shown that encrypted DNS is still sensitive to traffic analysis. As a consequence, RFC 8467 proposes to pad messages prior to encryption, which heavily reduces the characteristics of encrypted traffic. In this paper, we show that padding alone is insufficient to counter DNS traffic analysis. We propose a novel traffic analysis method that combines size and timing information to infer the websites a user visits purely based on encrypted and padded DNS traces. To this end, we model DNS sequences that capture the complexity of websites that usually trigger dozens of DNS resolutions instead of just a single DNS transaction. A closed world evaluation based on the Alexa top-10k websites reveals that attackers can deanonymize at least half of the test traces in 80.2% of all websites, and even correctly label all traces for 32.0% of the websites. Our findings undermine the privacy goals of state-of-the-art message padding strategies in DoT/DoH. We conclude by showing that successful mitigations to such attacks have to remove the entropy of inter-arrival timings between query responses.

研究动机与目标

调查DoT/DoH中的消息填充是否足以防止流量分析攻击。
评估当前加密DNS协议中填充策略的隐私保障能力。
评估对DNS流量进行序列级分析（包括时间和大小）是否可实现用户去匿名化。
开发并评估一种基于DNS事务序列推断访问网站的k-NN分类器。
证明现有防护措施在面对加密DNS中的高级流量分析时仍显不足。

提出的方法

作者对由网站触发的DNS解析序列进行建模，捕获查询的消息大小以及查询之间的到达时间间隔。
提出一种k-最近邻（k-NN）分类器，用于将观察到的DNS序列与已知的网站特征进行匹配。
该分类器使用从DNS消息大小分布和时间模式中提取的统计特征。
采用Alexa前10,000个网站的DNS追踪数据，在封闭世界环境下进行训练和测试。
该方法评估了完整序列和部分缓存序列的鲁棒性。
开放世界评估测量了误报率，表明该攻击在现实威胁模型下依然有效。

实验结果

研究问题

RQ1攻击者是否仅通过分析加密且已填充的DNS查询的大小和时间，就能实现用户去匿名化？
RQ2与单次事务分析相比，对DNS事务进行序列级分析在网站指纹识别方面能提升多少效果？
RQ3基于加密且已填充的DNS序列，k-NN分类器在识别网站方面的有效性如何？
RQ4DNS缓存对这类流量分析攻击成功率有何影响？
RQ5在开放世界设置下，该攻击能否在限制误报率的同时保持高准确率？

主要发现

攻击者仅通过分析加密且已填充的DNS序列，即可对Alexa前10,000个网站列表中10个网站中的5个实现至少80.2%的测试轨迹去匿名化。
该分类器在32.0%的网站中正确标记了所有轨迹，表明在部分情况下具有极高准确率。
即使排除缓存的DNS记录，只要训练数据中包含部分缓存的序列，分类器仍能保持高准确率。
误报率可控制在10%以内，同时维持40%的真正例率，表明该攻击具有可扩展性和实用性。
DNS查询间的时间信息提供的熵高于仅使用消息大小，对成功分类至关重要。
结果表明，当前DoT/DoH中的填充策略不足以防止流量分析，从而破坏了其隐私保障。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。