Skip to main content
QUICK REVIEW

[論文レビュー] Make up your mind: the price of online queries in differential privacy

Mark Bun, Thomas Steinke|arXiv (Cornell University)|Jan 16, 2017
Privacy-Preserving Technologies in Data被引用数 15
ひとこと要約

この論文は、オフライン、オンライン、適応的の3つの微分プライバシーのモデルが、その能力において根本的に異なることを示している。オフラインモデルでは、オンラインモデルよりも指数的に多くの統計的クエリを正確に回答できることを証明しており、オンラインモデルでは、適応的モデルよりも多くの検索クエリを回答できることを示しており、実際にはこれらのモデルが同等であるという仮定に疑問を呈している。

ABSTRACT

We consider the problem of answering queries about a sensitive dataset subject to differential privacy. The queries may be chosen adversarially from a larger set Q of allowable queries in one of three ways, which we list in order from easiest to hardest to answer:• Offline: The queries are chosen all at once and the differentially private mechanism answers the queries in a single batch.• Online: The queries are chosen all at once, but the mechanism only receives the queries in a streaming fashion and must answer each query before seeing the next query.• Adaptive: The queries are chosen one at a time and the mechanism must answer each query before the next query is chosen. In particular, each query may depend on the answers given to previous queries.Many differentially private mechanisms are just as efficient in the adaptive model as they are in the offline model. Meanwhile, most lower bounds for differential privacy hold in the offline setting. This suggests that the three models may be equivalent.We prove that these models are all, in fact, distinct. Specifically, we show that there is a family of statistical queries such that exponentially more queries from this family can be answered in the offline model than in the online model. We also exhibit a family of search queries such that exponentially more queries from this family can be answered in the online model than in the adaptive model. We also investigate whether such separations might hold for simple queries like threshold queries over the real line.

研究の動機と目的

  • オフライン、オンライン、適応的の3つの微分プライバシーのモデルが、正確に回答できるクエリ数の観点で同等かどうかを調査すること。
  • オフラインモデルで効率的なメカニズムが適応的設定でも効率的であるという一般的な仮定に挑戦すること。
  • 特定のクエリ族に対して、正確に回答できるクエリ数が指数的に異なることを示すことで、モデル間の形式的分離を確立すること。
  • このような分離が、実数直線上のしきい値クエリのような単純なクエリタイプにも拡張されるかどうかを調査すること。

提案手法

  • オフラインモデルがオンラインモデルよりも指数的に多くのクエリを正確に回答できる統計的クエリ族を構築すること。
  • オンラインモデルでは適応的モデルよりも著しく多くのクエリを回答できる検索クエリ族を設計すること。
  • 情報理論的議論を用いて、各モデル下での回答可能なクエリ数の下限を確立すること。
  • 適応的モデルにおけるクエリの依存構造(各クエリが以前の回答に依存する可能性があること)を分析し、困難の増加を示すこと。
  • クエリ複雑度を指標として用い、3つのモデル間で異なるプライバシー・ユーティリティのトレードオフを比較すること。
  • クエリ選択の構造(バッチ対ストリーミング対適応的)が、プライバシー・ユーティリティのトレードオフに根本的に影響することを示すこと。

実験結果

リサーチクエスチョン

  • RQ1オフライン、オンライン、適応的モデルは、正確に回答できるクエリ数の観点で同等であるか?
  • RQ2オフラインモデルとオンラインモデルの間で、正確に回答できるクエリ数に指数的ギャップが生じうるか?
  • RQ3特定のクエリ族に対して、オンラインモデルと適応的モデルの間に指数的分離が生じるか?
  • RQ4このような分離は、実数直線上のしきい値クエリのような単純なクエリタイプに対しても持続するか?

主な発見

  • オフラインモデルがオンラインモデルよりも指数的に多くのクエリを正確に回答できる統計的クエリ族が存在する。
  • オンラインモデルが適応的モデルよりも指数的に多くのクエリを正確に回答できる検索クエリ族が存在する。
  • オフライン、オンライン、適応的の3つのモデルは、微分プライバシー下でのクエリ回答能力において根本的に異なる。
  • 結果から、適応的モデルはオンラインモデルよりも、オンラインモデルはオフラインモデルよりも、特定のクエリ族に関しては厳密に制約が厳しいことが示されている。
  • これらの分離は複雑なクエリ族に限定されるものではなく、本稿では単純なクエリ(例:実数直線上のしきい値クエリ)に対しても同様のギャップが存在するか調査しているが、提供された要約ではそのようなクエリに対する明確な定量的結果は示されていない。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。