[論文レビュー] Necessary Conditions in Multi-Server Differential Privacy
本稿は、非インタラクティブでマルチサーバー型の微分プライバシー方式が、無限大の敵対者に対して有する根本的な制限を確立する。このような方式は、特徴選択、パリティ学習、仮説検定といった主要なタスクにおいて、中央集権型の類似手法に比べて指数関数的に多くのサンプルを必要とすることが示され、インタラクティビティまたは計算的微分プライバシーが中央モデルの効率性に並ぶために必要であることを示唆する。
We consider protocols where users communicate with multiple servers to perform a computation on the users' data. An adversary exerts semi-honest control over many of the parties but its view is differentially private with respect to honest users. Prior work described protocols that required multiple rounds of interaction or offered privacy against a computationally bounded adversary. Our work presents limitations of non-interactive protocols that offer privacy against unbounded adversaries. We show these protocols demand exponentially more samples for some learning and estimation tasks than centrally private counterparts. This means performing as well as the central model requires interactivity or computational differential privacy, or both.
研究の動機と目的
- 非インタラクティブでマルチサーバー型の微分プライバシー方式が、無限大の敵対者に対して有する制限を調査すること。
- このような方式が、学習および推定タスクにおいて中央モデルと同等のサンプル複雑性を達成できるかどうかを特定すること。
- サンプル複雑性ギャップを埋めるために、インタラクティビティまたは計算的微分プライバシーが必要かどうかを同定すること。
- 分散型微分プライバシーにおけるプライバシー、インタラクティビティ、サンプル効率性の間のトレードオフを形式化すること。
- マルチサーバー型モデルにおける特徴選択、パリティ学習、仮説検定、一様性検定のサンプル複雑性に対する下界を確立すること。
提案手法
- マルチサーバー方式を、逐次的な状態更新において内部的にプライベートなオンラインアルゴリズムに変換する。
- 内部プライバシーからの下界を適用して、学習タスクのサンプル複雑性の限界を導出する。
- 内部プライバシーと微分プライバシーの関係を用いて、内部プライバシー・モデルで知られている下界を移転する。
- 特徴選択および仮説検定における中央集権型のサンプル複雑性のベンチマークとして指数的メカニズムを用いる。
- 破損許容度(≤⌈k/2⌉サーバー)がプライバシー保証およびサンプル効率性に与える影響を分析する。
- 確率的議論とプライバシー制約下での失敗確率の制御を用いて、漸近的下界を導出する。
実験結果
リサーチクエスチョン
- RQ1非インタラクティブでマルチサーバー型の微分プライバシー方式は、特徴選択において中央モデルと同等のサンプル複雑性を達成できるか?
- RQ2無限大の敵対者を想定した非インタラクティブなマルチサーバー型モデルにおけるパリティ学習に必要な最小サンプル複雑性は何か?
- RQ3マルチサーバー型モデルにおける仮説検定のサンプル複雑性は中央モデルと比べてどの程度か?
- RQ4非インタラクティブなマルチサーバー型モデルで、効率的なサンプル複雑性を有する一様性検定は可能か?
- RQ5中央モデルの効率性に並ぶために、インタラクティビティまたは計算的微分プライバシーが不可欠となるか?
主な発見
- 特徴選択において、非インタラクティブなマルチサーバー方式は Ω(√d/αε) のサンプルを必要とするが、中央モデルでは指数的メカニズムにより O(log d/ε) で達成可能である。
- 非インタラクティブなマルチサーバー型モデルにおけるパリティ学習は、Ω(√(d choose t)/αε) のサンプルを要し、中央モデルの O(d/αε) と比べて指数的に多くなる。
- 単純な仮説検定においても、マルチサーバー型モデルでは Ω(√d/αε) のサンプルが必要であり、中央モデルの対数的複雑性と比べて指数的に劣る。
- マルチサーバー型モデルにおける一様性検定のサンプル複雑性の下界は Ω(d^{2/3}/α^{4/3}ε^{2/3} + √d/α² + 1/αε) であり、中央モデルの √d スケーリングと比べて多項式的に大きい。
- これらの結果は、非インタラクティブなマルチサーバー方式が、インタラクティビティまたは計算的微分プライバシーを備えなければ、中央モデルの効率性に並ぶことができないことを示唆する。
- δ = 0 または δlog(d/δ) ≪ α²ε²/d の場合でも下界が成立し、小さなプライバシーパラメータに対しても頑健であることが保証される。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。