QUICK REVIEW

[論文レビュー] Private Counting of Distinct and k-Occurring Items in Time Windows

Badih Ghazi, Ravi Kumar|arXiv (Cornell University)|Nov 21, 2022

Privacy-Preserving Technologies in Data被引用数 3

ひとこと要約

本稿では、イベントレベルおよびアイテムレベルのプライバシーの下で、時間ウィンドウ内の重複なしアイテムおよびk回出現するアイテムのカウントに、微分プライバシーを満たすアルゴリズムを提示し、ほぼタイトな誤差バウンドを達成している。本研究は、ボロットら（ICDT 2013）が提起した未解決問題を解決し、スライディングウィンドウサイズWに対して多項式対数的誤差を達成するイベントレベルDPアルゴリズムを提供する。

ABSTRACT

In this work, we study the task of estimating the numbers of distinct and $k$-occurring items in a time window under the constraint of differential privacy (DP). We consider several variants depending on whether the queries are on general time windows (between times $t_1$ and $t_2$), or are restricted to being cumulative (between times $1$ and $t_2$), and depending on whether the DP neighboring relation is event-level or the more stringent item-level. We obtain nearly tight upper and lower bounds on the errors of DP algorithms for these problems. En route, we obtain an event-level DP algorithm for estimating, at each time step, the number of distinct items seen over the last $W$ updates with error polylogarithmic in $W$; this answers an open question of Bolot et al. (ICDT 2013).

研究の動機と目的

動的データストリームにおける時間ウィンドウ内の重複なしアイテムおよびk回出現するアイテムのプライベート推定の課題に取り組む。
累積的、固定ウィンドウ、時間ウィンドウクエリ設定における、プライバシー（イベントレベル対アイテムレベルDP）とユーティリティ（誤差バウンド）のトレードオフを分析する。
純粋および近似DPのさまざまな設定において、誤差のほぼタイトな上界および下界を提供することで、先行研究のギャップを埋める。
ボロットら（ICDT 2013）が提起した、スライディングウィンドウにおける重複なしカウントのイベントレベルDPに関する未解決問題を解決する。
データ構造（1ステップあたり1つのアイテムのシングルトン対複数のアイテムを含むバンドル）が誤差とプライバシーのトレードオフに与える影響を調査する。

提案手法

スライディングウィンドウサイズWにおける重複なしアイテムの推定に、新しいイベントレベル微分プライバシーのアルゴリズムを設計し、誤差O(polylog W)を達成する。
時間ウィンドウにおける重複なしカウント問題を、動的データ構造上の2次元範囲カウント問題に還元し、プライベート範囲クエリ技術を活用する。
ラプラスメカニズムおよび出力摂動といった高度な微分プライバシー機構を適用し、イベントレベルおよびアイテムレベルの定義の両方でプライバシーを保証する。
1方向マージナル問題からの還元を用いて、一致する下界を導出し、上界の最適性を多項式対数的要因の範囲で証明する。
バケツ化と集約戦略を用いて、バンドル設定からシングルトン設定をシミュレートし、プライバシーを保持するとともに誤差の増大を制御する。
特に1方向マージナルクエリ問題に類似した既知の難問への還元を通じて、タイトな誤差バウンドを確立する。

実験結果

リサーチクエスチョン

RQ1イベントレベルおよびアイテムレベルDPの下で、時間ウィンドウ内の重複なしアイテムのカウントに、微分プライバシーを満たす場合に達成可能な最適な誤差は何か？
RQ2スライディングウィンドウにおける重複なしカウント問題において、イベントレベルDPでWに対して多項式対数的誤差を達成できるか？
RQ3シングルトンおよびバンドル設定における、k-出現アイテムカウントの誤差バウンドは、k、T、およびプライバシーパラメータǫおよびδとどのようにスケーリングするか？
RQ4さまざまなDP定義およびクエリタイプにおける、これらの問題の根本的な限界（下界）は何か？
RQ5同じプライバシー制約下で、累積的、固定ウィンドウ、一般時間ウィンドウクエリの間で、誤差バウンドはどのように異なるか？

主な発見

スライディングウィンドウサイズWにおける重複なしアイテムカウントに、誤差O(polylog W)を達成するイベントレベルDPアルゴリズムを提示し、ボロットら（ICDT 2013）が提起した未解決問題を解決した。
アイテムレベルDPおよびシングルトン設定では、純粋DPにおける時間ウィンドウCntOcc≥kの誤差バウンドがO(√(T/ǫ) · log¹·⁵ T)に達成された。
近似DPの下では、同じ設定における誤差バウンドはO(³√(T/ǫ²) · √(log(T/δ)) · log¹·⁵ T)であり、多項式対数的要因の範囲で下界と一致する。
下界の結果から、T ≥ k/ǫのシングルトン設定において、いかなるǫ-DPアルゴリズムでも誤差o(√(T/ǫk))を達成できないことが示された。
近似DPの下では、下界はo(³√(T log(1/δ)/(ǫ²k)))であり、多項式対数的要因の範囲で上界と一致する。
本研究の結果は、クエリタイプ（累積的、固定ウィンドウ、時間ウィンドウ）、プライバシーモデル（イベントレベル、アイテムレベル）、データモデル（シングルトン、バンドル）のすべての組み合わせにおいて、ほぼタイトな誤差バウンドを確立した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。