Skip to main content
QUICK REVIEW

[論文レビュー] Test without Trust: Optimal Locally Private Distribution Testing

Jayadev Acharya, Clément L. Canonne|arXiv (Cornell University)|Aug 7, 2018
Privacy-Preserving Technologies in Data被引用数 39
ひとこと要約

この論文は、均一性および独立性の検定において最適な標本量を達成するために、1ユーザーあたり1ビットの情報で十分な、新しい公開コイン型局所的微分プライバシー機構 Raptor を導入する。標本量のタイトな境界を確立し、公開コイン型メカニズム(例:Raptor)が最適な性能を達成できることを示している。一方、既存のプライベートコイン型メカニズム(例:RAPPOR、ハダマール・リスポンス)は、その本質的な制限により、顕著に多くの標本を必要としている。

ABSTRACT

We study the problem of distribution testing when the samples can only be accessed using a locally differentially private mechanism and focus on two representative testing questions of identity (goodness-of-fit) and independence testing for discrete distributions. We are concerned with two settings: First, when we insist on using an already deployed, general-purpose locally differentially private mechanism such as the popular RAPPOR or the recently introduced Hadamard Response for collecting data, and must build our tests based on the data collected via this mechanism; and second, when no such restriction is imposed, and we can design a bespoke mechanism specifically for testing. For the latter purpose, we introduce the Randomized Aggregated Private Testing Optimal Response (RAPTOR) mechanism which is remarkably simple and requires only one bit of communication per sample. We propose tests based on these mechanisms and analyze their sample complexities. Each proposed test can be implemented efficiently. In each case (barring one), we complement our performance bounds for algorithms with information-theoretic lower bounds and establish sample optimality of our proposed algorithm. A peculiar feature that emerges is that our sample-optimal algorithm based on RAPTOR uses public-coins, and any test based on RAPPOR or Hadamard Response, which are both private-coin mechanisms, requires significantly more samples.

研究の動機と目的

  • 高プライバシー制約下での分布検定において、最適な標本量を達成できる局所的微分プライバシー機構の設計。
  • 既存の LDP 機構(例:RAPPOR、ハダマール・リスポンス)と、離散分布の検定における最適性能との間のギャップの解消。
  • 公開ランダムネスを用い、均一性および独立性の検定において標本量最適な性能を達成する新しいメカニズム Raptor の開発。
  • 提案されたアルゴリズムの最適性を示す情報理論的下界の確立。

提案手法

  • 各ユーザーが、ドメインの公開に知られたランダムサブセットに属するかどうかを示す1ビットを送信する、公開コイン型の局所的プライバシー機構 Raptor を提案。
  • 3ビットの共同インジケータに対して、パラメータ $\varepsilon/3$ のランダム化応答を用い、3ビットの共同インジケータが $\varepsilon$-局所的微分プライバシーを満たすように保証。
  • 複数の独立した試行において中央値のトリックを用いて、成功確率を $2/3$ に向上。
  • 摂動された共同確率に対する集中不等式を用い、均一性や独立性からの逸脱を検出。
  • 定理28(共同確率の摂動の集中定理)を用い、全変動距離と観測可能なサブセット周波数との関係を確立。
  • 均一性検定への還元を用いて下界を確立し、$[k] \times [k]$ 上で独立性検定は均一性検定以上に難しいことを示した。

実験結果

リサーチクエスチョン

  • RQ1私たちは、$\varepsilon$-局所的微分プライバシー下で、分布検定の最適な標本量を達成できる局所的プライバシー機構を設計できるか?
  • RQ2なぜ RAPPOR やハダマール・リスポンスのようなプライベートコイン型メカニズムは、同じ検定タスクにおいて、公開コイン型メカニズムよりも顕著に多くの標本を必要とするのか?
  • RQ3一般用途の LDP 機構と、特定のタスクに最適化されたメカニズムの間には、分布検定において根本的な性能格差があるのか?
  • RQ4提案されたアルゴリズムの上界と一致する情報理論的下界を証明できるか?
  • RQ5局所的プライバシー下での独立性検定の最適な標本量は何か? そしてそれは均一性検定とどのように関係するか?

主な発見

  • Raptor は、$[k] \times [k]$ 上での独立性検定において、$O\left(\frac{k^2}{\gamma^2 \varepsilon^2}\right)$ の標本量を達成し、情報理論的に最適である。
  • Raptor の標本量は、$\Omega\left(\frac{k^2}{\gamma^2 \varepsilon^2}\right)$ の下界と一致しており、$\varepsilon \in (0,1]$ に対してその最適性が証明された。
  • RAPPOR やハダマール・リスポンスのようなプライベートコイン型メカニズムは、公開ランダムネスの欠如のため、Raptor よりも顕著に多くの標本を必要としている。
  • 本論文では、局所的プライバシー下での独立性検定が、$[k] \times [k]$ 上で局所的プライバシー下での均一性検定以上に難しいことを示し、$\Omega\left(\frac{k^2}{\gamma^2 \varepsilon^2}\right)$ の下界を確立した。
  • 主な技術的貢献として、定理28が挙げられ、これはランダムサブセット抽出下での共同確率の摂動の集中を確立し、サブセットベース推定器の解析を可能にしている。
  • 任意の $\varepsilon$-LDP 機構が独立性検定に用いるには、$\Omega\left(\frac{k^2}{\gamma^2 \varepsilon^2}\right)$ の標本が必要であることを示した。これにより、Raptor の最適性が確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。