QUICK REVIEW

[論文レビュー] Private Graphon Estimation for Sparse Graphs

Christian Borgs, Jennifer Chayes|arXiv (Cornell University)|Jun 19, 2015

Privacy-Preserving Technologies in Data参考文献 27被引用数 45

ひとこと要約

本稿では、スパースなネットワークにおけるグラフンの推定のためのノード微分プライバシーを満たすアルゴリズムを提示している。非パラメトリックなブロックモデル近似を用い、頂点数が増加するにつれて $L_2$ ノルムで真のグラフン $W$ に収束する。プライバシーはエッジカウントにラプラスノイズを追加することで確保され、平均次数が対数的成長し、適切なブロック数のスケーリングがなされるというやや弱い条件下で一貫性を示す。

ABSTRACT

We design algorithms for fitting a high-dimensional statistical model to a large, sparse network without revealing sensitive information of individual members. Given a sparse input graph $G$, our algorithms output a node-differentially-private nonparametric block model approximation. By node-differentially-private, we mean that our output hides the insertion or removal of a vertex and all its adjacent edges. If $G$ is an instance of the network obtained from a generative nonparametric model defined in terms of a graphon $W$, our model guarantees consistency, in the sense that as the number of vertices tends to infinity, the output of our algorithm converges to $W$ in an appropriate version of the $L_2$ norm. In particular, this means we can estimate the sizes of all multi-way cuts in $G$. Our results hold as long as $W$ is bounded, the average degree of $G$ grows at least like the log of the number of vertices, and the number of blocks goes to infinity at an appropriate rate. We give explicit error bounds in terms of the parameters of the model; in several settings, our bounds improve on or match known nonprivate results.

研究の動機と目的

大規模でスパースなネットワークにおける高次元統計モデルの推定のための微分プライバシーを満たすアルゴリズムを開発すること。
ノード微分プライバシーを保証すること、すなわち任意の頂点およびそのエッジの挿入または削除が攻撃者から隠されるようにすること。
理論的の一貫性保証を提供し、推定されたグラフンが $n \to \infty$ のとき真のグラフン $W$ に $L_2$ ノルムで収束することを示すこと。
非プライベートな結果と同等またはそれを上回るいくつかの設定において、明示的な誤差バウンドを導出すること。
推定されたグラフンを介してマルチウェイカットなどのグローバルグラフ特性のプライベート推定を可能にすること。

提案手法

アルゴリズムは、グラフを $k$ 個のブロックに分割し、各ブロック間のエッジ確率を推定する非パラメトリックなブロックモデル近似を用いる。
最小二乗推定を用いて、推定されたエッジ確率と観測されたエッジ確率の $L_2$ 距離を最小化することで、ブロックモデルを観測グラフにフィットさせる。
ノード微分プライバシーは、ブロック行列内の各エッジカウントにスケール $4/n\epsilon$ の独立したラプラスノイズを追加することで確保される。
推定されたエッジ確率行列 $\hat{B}$ は、推定された平均エッジ密度 $\hat{\rho}$ でスケーリングされ、グラフン推定の正規化が行われる。
ノイズを含む行列のエントリを $1/n$ の倍数に丸めることで、有効なブロックモデルパラメータを保証する。
度数およびエッジ確率の集中と期待値のバウンドは、補助的補題および尾確率不等式を用いて導出され、推定誤差を制御する。

実験結果

リサーチクエスチョン

RQ1微分プライバシーを満たすアルゴリズムは、個々のノードのプライバシーを保護しつつ、スパースネットワークにおけるグラフンを推定できるか？
RQ2どのような条件下でプライベートなグラフン推定器が $L_2$ ノルムで真のグラフンに収束するか？
RQ3同じ設定において、プライベート推定器の誤差バウンドは非プライベート推定器のものと比べてどのように異なるか？
RQ4プライベート推定器はマルチウェイカットのようなグローバルグラフ特性を正確に回復できるか？
RQ5スパースグラフ設定において、プライバシーパラメータ $\epsilon$、標本サイズ $n$、推定精度の間にはどのようなトレードオフがあるか？

主な発見

真のグラフン $W$ が有界で、平均次数が $\log n$ 以上で増加し、ブロック数 $k$ が適切なレートで増加するという条件下で、$n \to \infty$ のとき推定されたグラフンは $L_2$ ノルムで真のグラフンに収束する。
高確率で、推定誤差は $O\left(\sqrt[4]{\frac{\lambda^2 \log k}{\rho n}} + \lambda \sqrt{\frac{k^2 \log n}{n\epsilon}} + \frac{\sqrt{\lambda}}{n\rho\epsilon}\right)$ で抑えられる。ここで $\lambda$ はノイズスケールを制御する。
プライバシー予算がブロック行列内の各エッジカウントに割り当てられるため、アルゴリズムは $\epsilon$-微分プライバシーを満たすノード微分プライバシーを保証する。
正規化されたグラフン推定 $\hat{\delta}_2(\hat{W}, W)$ の誤差バウンドは、高確率で $\hat{\epsilon}_k^{(O)}(H_n(W)) + O\left(\sqrt[4]{\frac{\lambda^2 \log k}{\rho n}} + \lambda \sqrt{\frac{k^2 \log n}{n\epsilon}} + \frac{\sqrt{\lambda}}{n\rho\epsilon}\right)$ である。
$n\rho\epsilon / \log n \to \infty $ のとき、ほとんど確実な一貫性が達成され、正規化された推定器が真のグラフンに収束することが保証される。
このアプローチにより、$L_2$ での一貫性が保証されるため、マルチウェイカットのようなグローバルグラフ特性のプライベート推定が可能になる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。