Skip to main content
QUICK REVIEW

[论文解读] Privately Answering Counting Queries with Generalized Gaussian Mechanisms

Arun Ganesh, Jiazheng Zhao|arXiv (Cornell University)|Oct 4, 2020
Privacy-Preserving Technologies in Data参考文献 12被引用 2
一句话总结

本文提出了一种新颖的差分隐私机制,用于回答 k 个计数查询,采用形状参数为 p 的广义高斯噪声,实现 ℓ∞-误差为 O(√(k log log log k log(1/δ))/ϵ),将已知最优上界与下界之间在 ℓ∞-误差上的乘法差距从 O(√log log k) 缩小至 O(√log log log k)。该方法结合广义高斯机制与稀疏向量技术,以私密方式精炼高误差条目。

ABSTRACT

We consider the problem of answering $k$ counting (i.e. sensitivity-1) queries about a database with $(ε, δ)$-differential privacy. We give a mechanism such that if the true answers to the queries are the vector $d$, the mechanism outputs answers $ ilde{d}$ with the $\ell_\infty$-error guarantee: $$\mathcal{E}\left[|| ilde{d} - d||_\infty ight] = O\left(\frac{\sqrt{k \log \log \log k \log(1/δ)}}ε ight).$$ This reduces the multiplicative gap between the best known upper and lower bounds on $\ell_\infty$-error from $O(\sqrt{\log \log k})$ to $O(\sqrt{\log \log \log k})$. Our main technical contribution is an analysis of the family of mechanisms of the following form for answering counting queries: Sample $x$ from a extit{Generalized Gaussian}, i.e. with probability proportional to $\exp(-(||x||_p/σ)^p)$, and output $ ilde{d} = d + x$. This family of mechanisms offers a tradeoff between $\ell_1$ and $\ell_\infty$-error guarantees and may be of independent interest. For $p = O(\log \log k)$, this mechanism already matches the previous best known $\ell_\infty$-error bound. We arrive at our main result by composing this mechanism for $p = O(\log \log \log k)$ with the sparse vector mechanism, generalizing a technique of Steinke and Ullman.

研究动机与目标

  • 为差分隐私计数查询降低已知最优上界与下界之间在 ℓ∞-误差上的乘法差距。
  • 开发一种机制,实现比现有方法更紧致的 ℓ∞-误差保证,尤其改进 (ϵ,δ)-差分隐私下 O(√(k log log k log(1/δ))/ϵ) 的边界。
  • 分析广义高斯机制的隐私与效用特性,该机制在 ℓ1 与 ℓ∞ 误差之间提供权衡,并且比先前机制更简单。
  • 通过将广义高斯机制与稀疏向量机制组合,推广 Steinke 和 Ullman 的技术,以实现更优的误差控制。
  • 提供具有闭式表达、易于采样的噪声分布的机制,在保持隐私的同时最小化最坏情况误差。

提出的方法

  • 提出一种机制,向真实答案 d 添加噪声 x,其中 x 从形状参数为 p、尺度为 σ 的广义高斯分布中采样,即概率密度与 exp(−(||x||p/σ)^p) 成正比。
  • 对 p = O(log log log k) 使用广义高斯机制,以在保持每维坐标独立噪声的前提下,实现更优的 ℓ∞-误差界。
  • 将广义高斯机制与稀疏向量机制组合,以私密方式校正误差较大的条目。
  • 设定噪声尺度 σ = Θ(√(k^p log(1/δ))/ϵ),以平衡隐私与效用,确保满足 (ϵ,δ)-差分隐私。
  • 使用广义的切尔诺夫型不等式进行尾部概率分析,控制任一坐标超过阈值的概率,利用广义高斯分布中各坐标之间的独立性。
  • 通过联合界与集中不等式证明:以高概率,最多 O(k / log^{2+2t}k) 个条目具有较大绝对值,从而可通过稀疏向量机制实现有效校正。

实验结果

研究问题

  • RQ1广义高斯机制在 (ϵ,δ)-差分隐私下,能否在计数查询中实现优于高斯或拉普拉斯机制的 ℓ∞-误差?
  • RQ2在差分隐私查询发布中,ℓ1 与 ℓ∞ 误差之间的最优权衡是什么?能否通过单一噪声分布实现?
  • RQ3将广义高斯机制与稀疏向量机制组合,能否缩小已知上界与下界之间在 ℓ∞-误差上的差距?
  • RQ4使用 p = O(log log log k) 的广义高斯噪声,是否能获得比先前方法更紧致的 ℓ∞-误差界?
  • RQ5能否设计一种机制,通过独立且具有闭式表达的噪声采样,实现接近最优的 ℓ∞-误差,同时保持强隐私保证?

主要发现

  • 所提机制实现了 O(√(k log log log k log(1/δ))/ϵ) 的 ℓ∞-误差,将上界与下界之间乘法差距从 O(√log log k) 缩小至 O(√log log log k)。
  • 当 p = Θ(log log k) 时,该机制与先前已知最优 ℓ∞-误差界 O(√(k log log k log(1/δ))/ϵ) 一致,但采用更简单的独立噪声模型。
  • 通过组合形状参数为 p = O(log log log k) 的广义高斯机制与稀疏向量机制,并校准隐私参数,该机制确保了 (ϵ,δ)-差分隐私。
  • ℓ∞-误差超过 ct√(k^p log(1/δ)/ϵ) · (log log k)^{1/p} 的概率被控制在 e^{-log^t k} 以内,其衰减速度快于 k 的任意多项式。
  • 噪声分布具有解析可处理性且易于采样,与先前使用依赖噪声的机制不同,使本方法更具实用性。
  • 分析表明:以高概率,仅有 O(k / log^{2+2t}k) 个条目超过阈值,因此可通过稀疏向量机制实现有效校正。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。