QUICK REVIEW

[論文レビュー] Private False Discovery Rate Control

Cynthia Dwork, Weijie Su|arXiv (Cornell University)|Nov 12, 2015

Privacy-Preserving Technologies in Data参考文献 14被引用数 21

ひとこと要約

本稿では、プライバシー保護ステップを備えたBenjamini-Hochberg手順に適応することで、多重仮説検定における誤発見率（FDR）を制御する、最初の微分プライベートなアルゴリズムを提示する。弱い仮定の下で非プライベートなBHq手順に対する新しい証明と、低歪みの「ワンショット」型top-$k$プリミティブを導入し、微分プライベート性のもとで最小限のパワー損失でFDR制御を達成する。

ABSTRACT

We provide the first differentially private algorithms for controlling the false discovery rate (FDR) in multiple hypothesis testing, with essentially no loss in power under certain conditions. Our general approach is to adapt a well-known variant of the Benjamini-Hochberg procedure (BHq), making each step differentially private. This destroys the classical proof of FDR control. To prove FDR control of our method, (a) we develop a new proof of the original (non-private) BHq algorithm and its robust variants -- a proof requiring only the assumption that the true null test statistics are independent, allowing for arbitrary correlations between the true nulls and false nulls. This assumption is fairly weak compared to those previously shown in the vast literature on this topic, and explains in part the empirical robustness of BHq. Then (b) we relate the FDR control properties of the differentially private version to the control properties of the non-private version. \end{enumerate} We also present a low-distortion "one-shot" differentially private primitive for "top $k$" problems, e.g., "Which are the $k$ most popular hobbies?" (which we apply to: "Which hypotheses have the $k$ most significant $p$-values?"), and use it to get a faster privacy-preserving instantiation of our general approach at little cost in accuracy. The proof of privacy for the one-shot top~$k$ algorithm introduces a new technique of independent interest.

研究の動機と目的

多重仮説検定における誤発見率（FDR）制御のための、最初の微分プライベートなアルゴリズムを開発すること。
微分プライベート性のもとでFDR制御における統計的パワーを保持し、プライバシーの精度コストを最小限に抑えること。
真の帰無仮説の独立性のみを仮定する弱い条件下で、非プライベートなBenjamini-Hochberg手順の新しい理論的基盤を確立すること。
効率的かつ正確な最も顕著な$p$-値の選択を可能にする、低歪みのワンショット型微分プライベートtop-$k$アルゴリズムを設計すること。
プライベートなアルゴリズムのFDR制御特性を非プライベートバージョンと関連づけ、理論的厳密性を保証すること。

提案手法

各ステップを微分プライベートにするようにBenjamini-Hochberg段階的降下手順を適応し、古典的しきい値処理の代わりにプライベート統計的検定を用いる。
真の帰無仮説の検定統計量の独立性のみを仮定する、非プライベートなBHq手順の新しい証明を構築し、真の帰無仮説と偽の帰無仮説の間の任意の相関を許容する。
$k$番目に顕著な$p$-値を$O(\tfrac{\rho}{\rho^2})$の歪みで選択する、画期的な「ワンショット」型微分プライベートtop-$k$プリミティブを導入し、反復的ピーリング手法を凌駕する。
Bennettの不等式を用いてワンショット型top-$k$アルゴリズムのプライバシーを証明し、確率ベクトルの$c$-近接性の下での対数尤度比の集中限界を確立する。
新しい証明構造に基づくカップリング論法を用いて、プライベート版のFDR制御を非プライベート版と関連付ける。
$p$-値計算がノイズ機構の技術的条件を満たすことで、エンドツーエンドのプライバシーを実現する。

実験結果

リサーチクエスチョン

RQ1誤発見率（FDR）を制御する微分プライベートなアルゴリズムを設計可能か？その際、統計的パワーの損失を最小限に抑えることができるか？
RQ2非プライベートなBHq手順におけるFDR制御を保証するのに十分なテスト統計量に関する弱い仮定は何か？そして、その仮定をプライベートな設定でどのように活用できるか？
RQ3反復的ピーリングを回避し、$k$に非線形的依存性を示す低歪みの微分プライベートtop-$k$選択プリミティブを構築可能か？
RQ4微分プライベートなアルゴリズムのFDR制御特性を、その非プライベートな対応物と正式に関連づける方法は何か？
RQ5$p$-値計算に必要な技術的条件は何か？これにより、FDR制御パイプライン全体でエンドツーエンドの微分プライバシーを保証できるか？

主な発見

本稿では、真の帰無仮説の検定統計量の独立性のみを仮定する弱い条件下で、非プライベートなBHq手順の新しい証明を確立し、BHqの実験的頑健性を説明する。
提案された微分プライベートなFDR制御手法は、同じ弱い仮定のもとで、ほぼパワー損失のないFDR制御を達成し、プライバシーに配慮した環境での実用的導入を可能にする。
ワンショット型top-$k$プリミティブは、$k$に対して$O(\tfrac{\rho}{\rho^2})$の歪みを達成し、反復的ピーリング手法の最良既知の境界と一致するが、はるかに高い効率と低い計算コストを実現する。
ワンショット型top-$k$アルゴリズムのプライバシー証明は、対数尤度比の集中に基づく新技術を導入し、プライバシー研究分野において独立した関心を引く。
$p$-値計算の技術的条件を満たすことで、FDR制御パイプライン全体でエンドツーエンドの微分プライバシーを保証する。
理論的分析により、プライベート版のFDR制御が非プライベート版と密接に関連していることが確認され、信頼性と解釈可能性が保証される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。