Skip to main content
QUICK REVIEW

[論文レビュー] A New Class of Private Chi-Square Tests

Daniel Kifer, Ryan Rogers|arXiv (Cornell University)|Oct 24, 2016
Random Matrices and Applications被引用数 10
ひとこと要約

この論文は、微分プライバシーのためのノイズを追加した後でも、古典的カイ二乗検定の漸近的分布を保持する、新しいプライベートカイ二乗検定統計量のクラスを導入する。ノイズを加えた統計量の漸近的性質を、標準的カイ二乗検定と一致させることで、従来の統計量を単にプライベート化する手法よりも優れた実験的性能を達成する。

ABSTRACT

In this paper, we develop new test statistics for private hypothesis testing. These statistics are designed specifically so that their asymptotic distributions, after accounting for noise added for privacy concerns, match the asymptotics of the classical (non-private) chi-square tests for testing if the multinomial data parameters lie in lower dimensional manifolds (examples include goodness of fit and independence testing). Empirically, these new test statistics outperform prior work, which focused on noisy versions of existing statistics.

研究の動機と目的

  • 微分プライバシー下で古典的カイ二乗検定の漸近的性質を保持できない既存の手法のギャップを埋める。
  • プライバシーのためのノイズを注入した後でも、古典的カイ二乗検定と同一の漸近的帰無分布を維持する統計量を開発する。
  • 従来の統計量にノイズを単に適用する手法と比較して、プライベートな適合度検定および独立性検定における実験的パワーと正確性を向上させる。
  • プライバシー制約下でも、統計量の漸近的挙動が非プライベートなカイ二乗検定と一貫性を保つように保証する。

提案手法

  • 著者らは、古典的カイ二乗検定統計量と構造的に類似しているが、微分プライバシーのためのノイズを考慮して解析的に調整された新しい統計量を設計する。
  • 帰無仮説の下でのこれらの新しい統計量の漸近的分布を導出し、ノイズ追加後も古典的カイ二乗分布と一致することを保証する。
  • プライバシーのためのノイズによる摂動が極限分布を変化させないよう、統計量の形式を変更する。
  • 形式的な漸近的解析を用いて、ノイズを加えた統計量が、非プライベートな対応物と同じカイ二乗分布に分布収束することを示す。
  • このアプローチにより、プライバシー保護ノイズが存在しても、標準的な仮説検定手順に適切に適用可能であることを保証する。
  • 適合度検定やクロス表における独立性検定を含む、さまざまな多項分布パラメータの検定問題に一般化可能である。

実験結果

リサーチクエスチョン

  • RQ1古典的カイ二乗検定の漸近的帰無分布を保持する微分プライベートな統計量を設計できるか?
  • RQ2プライバシーのためのノイズ追加が、統計量の根本的な漸近的挙動を変えることを防げるか?
  • RQ3従来の統計量にノイズを単に適用する手法と比較して、新しいプライベート統計量は実験的パワーと正確性において優れているか?
  • RQ4新しい統計量は、適合度検定や独立性検定を含む標準的な多項分布の検定問題に適用可能であり、理論的妥当性を維持できるか?
  • RQ5微分プライバシー下で漸近的同等性を維持するために、古典的統計量に必要な修正は何か?

主な発見

  • 提案された統計量は、微分プライバシーのためのノイズ追加後でさえ、古典的カイ二乗検定と正確に一致する漸近的分布を達成する。
  • 実験的に、構造的適合なしに既存の統計量にノイズを追加する従来の手法と比較して、新しい統計量は優れた性能を示す。
  • 帰無仮説の下で理論的妥当性が保たれ、大標本における正しい第一種の過誤率を保証する。
  • このアプローチは、適合度検定や独立性検定を含む標準的な多項分布の検定問題に適用可能である。
  • プライベート統計量と古典的統計量の間の漸近的同等性により、実際の応用において標準的な臨界値とp値を使用可能になる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。