QUICK REVIEW

[论文解读] Hiding the Access Pattern is Not Enough: Exploiting Search Pattern Leakage in Searchable Encryption

Simon Oya, Florian Kerschbaum|arXiv (Cornell University)|Oct 7, 2020

Cryptography and Data Security被引用 27

一句话总结

本文提出了一种新型的可搜索对称加密（SSE）查询恢复攻击，结合访问模式泄漏（每个查询检索的文档集合）和搜索模式泄漏（相同查询的频率）来以高精度识别客户端关键词。通过将攻击建模为通过非平衡分配求解的最大似然估计问题，该方法优于以往的攻击，并在高隐私配置下仍能攻破三种评估防御中的两种，表明隐藏搜索模式泄漏对于SSE中的实际隐私保护至关重要。

ABSTRACT

Recent Searchable Symmetric Encryption (SSE) schemes enable secure searching over an encrypted database stored in a server while limiting the information leaked to the server. These schemes focus on hiding the access pattern, which refers to the set of documents that match the client's queries. This provides protection against current attacks that largely depend on this leakage to succeed. However, most SSE constructions also leak whether or not two queries aim for the same keyword, also called the search pattern. In this work, we show that search pattern leakage can severely undermine current SSE defenses. We propose an attack that leverages both access and search pattern leakage, as well as some background and query distribution information, to recover the keywords of the queries performed by the client. Our attack follows a maximum likelihood estimation approach, and is easy to adapt against SSE defenses that obfuscate the access pattern. We empirically show that our attack is efficient, it outperforms other proposed attacks, and it completely thwarts two out of the three defenses we evaluate it against, even when these defenses are set to high privacy regimes. These findings highlight that hiding the search pattern, a feature that most constructions are lacking, is key towards providing practical privacy guarantees in SSE.

研究动机与目标

调查已隐藏访问模式的可搜索对称加密（SSE）方案中，搜索模式泄漏所引发的隐私风险。
开发一种结合访问模式（检索的文档集合）和搜索模式（查询频率）泄漏的实用攻击，以恢复客户端查询关键词。
评估现有隐私保护SSE防御机制在该新攻击下的有效性，尤其是在高隐私配置下。
证明即使在具有理论隐私保证的情况下，当前防御机制在面对访问模式与搜索模式泄漏的联合泄露时仍会失效。
倡导在未来的SSE设计中将隐藏搜索模式作为核心要求，以实现有意义的隐私保障。

提出的方法

将查询恢复问题建模为最大似然估计（MLE）任务，以观测到的访问模式和查询频率作为输入。
将攻击建模为非平衡分配问题，以将观测到的查询模式映射到候选关键词，优化匹配的可能性。
利用背景信息（如关键词共现模式和一般查询频率分布）引导估计过程。
将攻击适配于多种SSE防御机制，包括通过引入虚假正负样本或使用噪声填充来混淆访问模式的方案。
在真实世界数据集上进行实证评估，测量在不同条件和防御设置下的查询恢复准确率。
采用概率框架，同时考虑响应量（来自访问模式）和查询重复次数（来自搜索模式），以提高推断准确率。

实验结果

研究问题

RQ1在已隐藏访问模式的SSE方案中，搜索模式泄漏（即相同查询的频率）在多大程度上会破坏其隐私？
RQ2对访问模式和搜索模式泄漏进行联合分析，是否能显著提高查询恢复率，超过单独使用任一类型泄漏的效果？
RQ3当前最先进的SSE防御机制在抵御同时利用访问和搜索模式泄漏的攻击时，其有效性如何？
RQ4在仅具备最少背景信息（如一般关键词共现或频率分布）的情况下，能达到多高的查询恢复准确率？
RQ5设计一种能同时隐藏访问和搜索模式泄漏的高效SSE方案是否可行？其主要挑战是什么？

主要发现

所提出的攻击通过结合访问模式（文档集合）和搜索模式（查询频率）泄漏，实现了高查询恢复率，优于仅依赖单一泄漏类型的方法。
即使在背景信息较弱的情况下（如仅掌握一般关键词共现模式和近似查询频率），该攻击仍能以仅250次查询从1,000个关键词的词库中恢复出23%的查询。
在评估的三种隐私保护SSE防御机制中，有两项在高隐私配置下仍无法提供有效防护。
该攻击对使用虚假正负样本或拉普拉斯噪声填充以隐藏访问模式和响应量的防御机制依然有效。
结果表明，当与访问模式数据结合时，仅搜索模式泄漏即可实现实际且可扩展的查询恢复，从而破坏原本安全的SSE方案的安全性。
本研究结论指出，隐藏搜索模式是实现SSE实际隐私的必要条件；当前忽略此保护机制的SSE方案在真实世界攻击下均易受攻击。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。