Skip to main content
QUICK REVIEW

[论文解读] Differentially Private Data Analysis of Social Networks via Restricted Sensitivity

Jeremiah Blocki, Avrim Blum|arXiv (Cornell University)|Aug 22, 2012
Privacy-Preserving Technologies in Data参考文献 15被引用 1
一句话总结

本文提出受限敏感性——一种新颖的差分隐私方法,通过利用关于数据结构的先验信念(如社交网络中的有界度数)来提高准确性。通过在受限假设类(例如最大度数为k的图)上将查询转换为具有低全局敏感性的形式,该方法在即使假设不成立的情况下也能保持隐私的前提下,实现更精确的私有分析。

ABSTRACT

We introduce the notion of restricted sensitivity as an alternative to global and smooth sensitivity to improve accuracy in differentially private data analysis. The definition of restricted sensitivity is similar to that of global sensitivity except that instead of quantifying over all possible datasets, we take advantage of any beliefs about the dataset that a querier may have, to quantify over a restricted class of datasets. Specifically, given a query f and a hypothesis H about the structure of a dataset D, we show generically how to transform f into a new query f_H whose global sensitivity (over all datasets including those that do not satisfy H) matches the restricted sensitivity of the query f. Moreover, if the belief of the querier is correct (i.e., D is in H) then f_H(D) = f(D). If the belief is incorrect, then f_H(D) may be inaccurate. We demonstrate the usefulness of this notion by considering the task of answering queries regarding social-networks, which we model as a combination of a graph and a labeling of its vertices. In particular, while our generic procedure is computationally inefficient, for the specific definition of H as graphs of bounded degree, we exhibit efficient ways of constructing f_H using different projection-based techniques. We then analyze two important query classes: subgraph counting queries (e.g., number of triangles) and local profile queries (e.g., number of people who know a spy and a computer-scientist who know each other). We demonstrate that the restricted sensitivity of such queries can be significantly lower than their smooth sensitivity. Thus, using restricted sensitivity we can maintain privacy whether or not D is in H, while providing more accurate results in the event that H holds true.

研究动机与目标

  • 解决社交网络差分隐私分析中全局敏感度和平滑敏感度过高的挑战,后者会导致噪声过大、效用降低。
  • 开发一种框架,通过整合关于网络结构的先验知识(如度数有界)来提高准确性,同时不损害隐私性。
  • 在底层数据满足结构性假设(如度数有界)时,实现准确的私有查询回答,且无论该假设是否成立,均保持差分隐私。
  • 设计高效机制,将查询转换为在受限敏感性下具有低全局敏感性的形式,尤其针对子图计数和局部轮廓查询。
  • 证明对于自然的社交网络查询,受限敏感性可显著低于平滑敏感度,从而在实践中实现更高准确性。

提出的方法

  • 将受限敏感性定义为查询输出在假设类H内相邻数据集之间的最大变化,而非在所有可能的数据集上。
  • 提出一种通用查询f到新查询fH的转换方法,使得当D ∈ H时fH(D) = f(D),但fH在所有数据集上均具有低全局敏感性。
  • 针对特定假设Hk(有界度数k),设计基于投影的高效技术,以构建子图计数和局部轮廓查询的fH。
  • 使用边邻接和顶点邻接模型来形式化隐私保证,确保即使D不满足H,差分隐私依然成立。
  • 利用结构约束(如度数界限)来限制查询的受限敏感性,从而实现与该更小敏感性成比例的噪声添加。
  • 构建从一般图到假设类Hk的高效映射,以支持该方法的实际部署。

实验结果

研究问题

  • RQ1受限敏感性能否用于设计显著优于基于全局或平滑敏感性的差分隐私机制?
  • RQ2在多大程度上可以利用关于社交网络的先验结构信念(如度数有界)来降低敏感性并提高私有查询发布中的准确性?
  • RQ3是否可能构建高效且差分隐私的查询机制,在假设H下保持低敏感性,即使该假设不成立?
  • RQ4对于常见的社交网络查询(如三角形计数和局部轮廓查询),受限敏感性与平滑敏感性相比如何?
  • RQ5能否构建高效且计算可行的映射,将任意图投影到假设类Hk,同时保持敏感性界限?

主要发现

  • 对于最大度数为k的图上的子图计数查询,受限敏感性在边邻接和顶点邻接模型中均被限制为tkt−1,其中t为子图中的顶点数。
  • 对于局部轮廓查询,受限敏感性在顶点邻接模型中最多为2k + 1,在边邻接模型中最多为k + 1,远低于最坏情况下O(n)的平滑敏感度。
  • 在顶点邻接模型中,局部轮廓查询的受限敏感性被限制为2k + 1,而其平滑敏感度最高可达n − 1,表明存在超多项式差距。
  • 对于三角形计数(子图计数的特例),受限敏感性最多为3k²,而查询的最大可能值为nk²,显示出显著的噪声效率提升。
  • 当假设Hk(有界度数)成立时,该方法在准确性上优于基于平滑敏感性的机制,且即使Hk不成立,仍能保持差分隐私。
  • 通过投影技术,Hk的fH存在高效构造,使得尽管通用转换在一般情况下不可计算,该方法仍可实际部署。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。