Skip to main content
QUICK REVIEW

[论文解读] The Privacy Funnel from the viewpoint of Local Differential Privacy

Milan Lopuhaä-Zwakenberg|arXiv (Cornell University)|Feb 4, 2020
Educational Reforms and Innovations被引用 4
一句话总结

本文提出在隐私漏斗框架下,使用局部信息隐私(LIP)作为局部微差隐私(LDP)在数据库清洗中的更优替代方案。通过将最优清洗协议建模为凸优化问题,作者表明,与LDP相比,LIP在计算速度上显著更快,且在小隐私预算下与隐私目标的对齐性更好,同时保持了强大的最坏情况隐私保障和在单属性与多属性场景下的良好效用。

ABSTRACT

We consider a database $\vec{X} = (X_1,\cdots,X_n)$ containing the data of $n$ users. The data aggregator wants to publicise the database, but wishes to sanitise the dataset to hide sensitive data $S_i$ correlated to $X_i$. This setting is considered in the Privacy Funnel, which uses mutual information as a leakage metric. The downsides to this approach are that mutual information does not give worst-case guarantees, and that finding optimal sanitisation protocols can be computationally prohibitive. We tackle these problems by using differential privacy metrics, and by considering local protocols which operate on one entry at a time. We show that under both the Local Differential Privacy and Local Information Privacy leakage metrics, one can efficiently obtain optimal protocols; however, Local Information Privacy is both more closely aligned to the privacy requirements of the Privacy Funnel scenario, and more efficiently computable. We also consider the scenario where each user has multiple attributes (i.e. $X_i = (X^1_i,\cdots,X^m_i)$), for which we define \emph{Side-channel Resistant Local Information Privacy}, and we give efficient methods to find protocols satisfying this criterion while still offering good utility. Exploratory experiments confirm the validity of these methods.

研究动机与目标

  • 解决经典隐私漏斗方法在大规模数据库发布中计算不可行性及平均情况隐私限制的问题。
  • 用更强的最坏情况隐私度量(特别是局部微差隐私LDP和局部信息隐私LIP)替代互信息泄露,以确保对每个个体的稳健保护。
  • 开发高效、可扩展的方法,以计算在LDP和LIP下的最优清洗协议,重点聚焦于对每个用户数据独立操作的本地协议。
  • 通过引入抗侧信道局部信息隐私(SRLIP),将框架扩展至多属性数据,以防止属性间相关性导致的泄露。
  • 评估不同隐私度量和数据设置下,隐私、效用与计算效率之间的权衡。

提出的方法

  • 将清洗问题建模为在条件概率分布Q(y|x)空间上的凸优化问题,受ε-LIP或ε-LDP条件约束。
  • 使用线性规划计算ε-LIP下的最优协议,利用LIP约束定义的多面体顶点数少于LDP约束的特性。
  • 对于多属性数据,定义ε-SRLIP为更严格的隐私条件,防止跨属性的侧信道泄露,需对所有属性组施加联合约束。
  • 通过在变换后的多面体上进行顶点枚举,开发计算ε-SRLIP协议的方法,尽管其计算开销高于LIP。
  • 通过在不同隐私预算和属性数量的合成数据上进行数值实验,比较LIP与LDP的性能。
  • 利用ε-LIP蕴含ε/2-LDP的事实,推导出LDP协议的效用下界,从而实现高效近似。

实验结果

研究问题

  • RQ1局部信息隐私(LIP)能否为隐私漏斗框架下的最优数据库清洗提供比局部微差隐私(LDP)更高效、更准确的替代方案?
  • RQ2在小隐私预算下,寻找最优协议时,LIP与LDP的计算复杂度相比如何?
  • RQ3在联合分布pS,X已知的隐私漏斗场景中,LIP在多大程度上更符合隐私需求?
  • RQ4能否高效计算更强的隐私度量(如抗侧信道局部信息隐私SRLIP),同时在多属性场景中保持良好效用?
  • RQ5在多属性数据发布中,使用SRLIP与LIP或LDP相比,隐私强度、计算成本与效用之间的权衡如何?

主要发现

  • 对于给定的隐私预算ε,ε-LIP下的最优清洗协议计算速度显著快于ε-LDP,且在ε值较小时优势更加明显。
  • ε-LIP下的最优效用始终高于ε-LDP,且互信息I(X;Y)的差异较小——通常低于5%,尽管LIP是更严格的隐私度量。
  • 与ε/2-LDP相比,LIP协议在效用上更高,计算速度也快得多,且在所有测试的ε值下,效用差距保持较低。
  • 对于多属性数据,基于定理2(ε-LIP)的方法平均比基于定理3(ε-SRLIP)的方法快476倍,尽管后者提供更强的隐私保障。
  • ε-SRLIP下的效用损失可测量但可接受,且该方法对侧信道攻击具有鲁棒性,因此在敏感多属性场景中具有合理性。
  • 随着ε增大,LIP与LDP之间的性能差异减小,因为更多协议同时满足两者条件,导致多面体结构相似,从而计算时间和效用趋于一致。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。