[論文レビュー] Separating Local & Shuffled Differential Privacy via Histograms
本稿は、データドメインサイズに依存しない誤差を達成するシャッフルベースのプロトコルを提示し、シャッフル型とローカル型の微分プライバシーのモデル間で、サンプル複雑性に任意に大きな隔たりを示す。主な貢献は、シャッフル型モデルで同時誤差O(log(1/δ)/(ε²n))を達成するプロトコルであり、これはローカル型モデルのΩ(√log d/(ε√n))と対照的である。また、純粋な微分プライバシーでは、シャッフル型モデルが単一メッセージプロトコルにおいてローカル型モデルに還元されることを証明している。
Recent work in differential privacy has highlighted the shuffled model as a promising avenue to compute accurate statistics while keeping raw data in users' hands. We present a protocol in this model that estimates histograms with error independent of the domain size. This implies an arbitrarily large gap in sample complexity between the shuffled and local models. On the other hand, we show that the models are equivalent when we impose the constraints of pure differential privacy and single-message randomizers.
研究の動機と目的
- シャッフル型とローカル型の微分プライバシーのモデル間の精度の隔たりを調査すること。
- ドメインサイズに依存しない誤差を達成するシャッフル型モデルにおけるヒストグラム推定プロトコルを設計すること。
- ローカル型とシャッフル型モデルの間で、サンプル複雑性の定量的隔たりを確立すること。
- 純粋な微分プライバシー制約下でのシャッフル型モデルの限界を探索すること。
- 純粋な微分プライバシーが単一メッセージシャッフルプロトコルにおいてローカルプロトコルと同等であることを示すこと。
提案手法
- 調整されたノイズを用いたランダム化応答を用いた、新しいシャッフルベースのヒストグラム推定プロトコルを導入する。
- ユーザーのメッセージを匿名化するための事前シャッフルメカニズムを採用し、より強いプライバシー保証を可能にする。
- メッセージの分布に関する統計的分析を用いて、すべてのヒストグラムビンにおける同時誤差を上限付ける。
- ポインターチェージおよびマルチパーティーサイドポインタジャンプ問題からの還元を適用し、サンプル複雑性の下界を確立する。
- 純粋な微分プライバシーにおいて、任意の単一メッセージシャッフルプロトコルが、同一のプライバシーと正確性を保証するローカルプロトコルによってシミュレート可能であることを証明する。
- シャッフルによる強化の補題と統計的距離の議論を用いて、プライバシーと正確性の境界を導出する。
実験結果
リサーチクエスチョン
- RQ1シャッフル型モデルにおけるヒストグラム推定は、データドメインサイズdに依存しない誤差を達成できるか?
- RQ2分布推定において、ローカル型とシャッフル型モデルの間で、サンプル複雑性の定量的隔たりは何か?
- RQ3精度とサンプル効率の観点から、シャッフル型モデルはローカル型モデルに顕著な利点を提供するか?
- RQ4どのような条件下で、プライバシーと正確性の観点からシャッフル型モデルはローカル型モデルに還元されるか?
- RQ5単一メッセージシャッフルプロトコルにおける純粋な微分プライバシーは、プライバシーまたは正確性の損失なしにローカルプロトコルによってシミュレート可能か?
主な発見
- 提案されたプロトコルは、シャッフル型モデルでドメインサイズdに依存しない同時誤差O(log(1/δ)/(ε²n))を達成する。
- log(1/δ) = o(log d)のとき、この誤差境界は先行研究よりも厳密に小さい。特に、ブラウザのホームページなど大規模ドメイン設定において顕著である。
- シャッフル型モデルのサンプル複雑性は問題パラメータに依存しなくなり得るが、ローカル型モデルではこれらのパラメータに比例して増加する。これにより、任意に大きな隔たりが示された。
- 純粋な微分プライバシーにおいて、すべての単一メッセージシャッフルプロトコルは、同一のプライバシーとサンプル複雑性の保証を持つローカルプロトコルによってシミュレート可能である。
- 本稿は、マルチメッセージシャッフルプロトコルが、そのランダムライザーが非プライバシーである場合でもε-微分プライバシーである可能性がある反例を構築し、プライバシーの強化がランダムライザーのレベルにまで拡張されないことを示している。
- ポインターチェージ問題における非インタラクティブローカルプロトコルの下界Ω(ℓ/eε)は、非インタラクティブローカル型とシャッフル型モデルの間で、任意に大きな隔たりを示している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。