[论文解读] Privately Answering Counting Queries with Generalized Gaussian Mechanisms
本文提出了一种新颖的差分隐私机制,用于回答 k 个计数查询,采用形状参数为 p 的广义高斯噪声,实现 ℓ∞-误差为 O(√(k log log log k log(1/δ))/ϵ),将已知最优上界与下界之间在 ℓ∞-误差上的乘法差距从 O(√log log k) 缩小至 O(√log log log k)。该方法结合广义高斯机制与稀疏向量技术,以私密方式精炼高误差条目。
We consider the problem of answering $k$ counting (i.e. sensitivity-1) queries about a database with $(ε, δ)$-differential privacy. We give a mechanism such that if the true answers to the queries are the vector $d$, the mechanism outputs answers $ ilde{d}$ with the $\ell_\infty$-error guarantee: $$\mathcal{E}\left[|| ilde{d} - d||_\infty ight] = O\left(\frac{\sqrt{k \log \log \log k \log(1/δ)}}ε ight).$$ This reduces the multiplicative gap between the best known upper and lower bounds on $\ell_\infty$-error from $O(\sqrt{\log \log k})$ to $O(\sqrt{\log \log \log k})$. Our main technical contribution is an analysis of the family of mechanisms of the following form for answering counting queries: Sample $x$ from a extit{Generalized Gaussian}, i.e. with probability proportional to $\exp(-(||x||_p/σ)^p)$, and output $ ilde{d} = d + x$. This family of mechanisms offers a tradeoff between $\ell_1$ and $\ell_\infty$-error guarantees and may be of independent interest. For $p = O(\log \log k)$, this mechanism already matches the previous best known $\ell_\infty$-error bound. We arrive at our main result by composing this mechanism for $p = O(\log \log \log k)$ with the sparse vector mechanism, generalizing a technique of Steinke and Ullman.
研究动机与目标
- 为差分隐私计数查询降低已知最优上界与下界之间在 ℓ∞-误差上的乘法差距。
- 开发一种机制,实现比现有方法更紧致的 ℓ∞-误差保证,尤其改进 (ϵ,δ)-差分隐私下 O(√(k log log k log(1/δ))/ϵ) 的边界。
- 分析广义高斯机制的隐私与效用特性,该机制在 ℓ1 与 ℓ∞ 误差之间提供权衡,并且比先前机制更简单。
- 通过将广义高斯机制与稀疏向量机制组合,推广 Steinke 和 Ullman 的技术,以实现更优的误差控制。
- 提供具有闭式表达、易于采样的噪声分布的机制,在保持隐私的同时最小化最坏情况误差。
提出的方法
- 提出一种机制,向真实答案 d 添加噪声 x,其中 x 从形状参数为 p、尺度为 σ 的广义高斯分布中采样,即概率密度与 exp(−(||x||p/σ)^p) 成正比。
- 对 p = O(log log log k) 使用广义高斯机制,以在保持每维坐标独立噪声的前提下,实现更优的 ℓ∞-误差界。
- 将广义高斯机制与稀疏向量机制组合,以私密方式校正误差较大的条目。
- 设定噪声尺度 σ = Θ(√(k^p log(1/δ))/ϵ),以平衡隐私与效用,确保满足 (ϵ,δ)-差分隐私。
- 使用广义的切尔诺夫型不等式进行尾部概率分析,控制任一坐标超过阈值的概率,利用广义高斯分布中各坐标之间的独立性。
- 通过联合界与集中不等式证明:以高概率,最多 O(k / log^{2+2t}k) 个条目具有较大绝对值,从而可通过稀疏向量机制实现有效校正。
实验结果
研究问题
- RQ1广义高斯机制在 (ϵ,δ)-差分隐私下,能否在计数查询中实现优于高斯或拉普拉斯机制的 ℓ∞-误差?
- RQ2在差分隐私查询发布中,ℓ1 与 ℓ∞ 误差之间的最优权衡是什么?能否通过单一噪声分布实现?
- RQ3将广义高斯机制与稀疏向量机制组合,能否缩小已知上界与下界之间在 ℓ∞-误差上的差距?
- RQ4使用 p = O(log log log k) 的广义高斯噪声,是否能获得比先前方法更紧致的 ℓ∞-误差界?
- RQ5能否设计一种机制,通过独立且具有闭式表达的噪声采样,实现接近最优的 ℓ∞-误差,同时保持强隐私保证?
主要发现
- 所提机制实现了 O(√(k log log log k log(1/δ))/ϵ) 的 ℓ∞-误差,将上界与下界之间乘法差距从 O(√log log k) 缩小至 O(√log log log k)。
- 当 p = Θ(log log k) 时,该机制与先前已知最优 ℓ∞-误差界 O(√(k log log k log(1/δ))/ϵ) 一致,但采用更简单的独立噪声模型。
- 通过组合形状参数为 p = O(log log log k) 的广义高斯机制与稀疏向量机制,并校准隐私参数,该机制确保了 (ϵ,δ)-差分隐私。
- ℓ∞-误差超过 ct√(k^p log(1/δ)/ϵ) · (log log k)^{1/p} 的概率被控制在 e^{-log^t k} 以内,其衰减速度快于 k 的任意多项式。
- 噪声分布具有解析可处理性且易于采样,与先前使用依赖噪声的机制不同,使本方法更具实用性。
- 分析表明:以高概率,仅有 O(k / log^{2+2t}k) 个条目超过阈值,因此可通过稀疏向量机制实现有效校正。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。