QUICK REVIEW

[論文レビュー] BLENDER: Enabling Local Search with a Hybrid Differential Privacy Model

Brendan Avent, Aleksandra Korolova|arXiv (Cornell University)|May 2, 2017

Privacy-Preserving Technologies in Data参考文献 29被引用数 49

ひとこと要約

本稿では、ローカルプライバシーと信頼できるキュレータープライバシーの2つのモデルを組み合わせることで、ローカル検索アプリケーションにおけるデータの有用性を向上させるハイブリッド型微分プライバシーモデルBLENDERを提案する。オプトインユーザーを活用して高精度な推定を実現するとともに、クライアント側でロバストなローカル摂動を適用することで、2つの大きな検索クリックデータセットにおいて、さまざまなプライバシー予算下でNDCGスコアが95％を超える成果を達成した。

ABSTRACT

We propose a hybrid model of differential privacy that considers a combination of regular and opt-in users who desire the differential privacy guarantees of the local privacy model and the trusted curator model, respectively. We demonstrate that within this model, it is possible to design a new type of blended algorithm for the task of privately computing the head of a search log. This blended approach provides significant improvements in the utility of obtained data compared to related work while providing users with their desired privacy guarantees. Specifically, on two large search click data sets, comprising 1.75 and 16 GB respectively, our approach attains NDCG values exceeding 95% across a range of privacy budget values.

研究の動機と目的

大規模なデータ収集におけるユーザーのプライバシーとデータの有用性の間の葛藤を解消すること。
ローカルモデルにおける有用性の向上により、中小組織が微分プライバシーを採用できるようにすること。
データキュレーターに対するユーザーの信頼度の違いを尊重するハイブリッドプライバシー・モデルの設計。
ブレンド手法を用いることで、ローカル検索ログ構築における顕著な有用性の向上を実証すること。

提案手法

ユーザーを2つのグループに分類する：『クライアント』（ローカル微分プライバシーを用いる）と『オプトイン』ユーザー（キュレーターを信頼する）。
ランダム化応答や類似手法を用いて、クライアントのデータにローカル摂動を適用し、ローカルプライバシーを確保する。
信頼できるキュレーター・モデルを用いて、オプトインユーザーからの摂動済み統計を収集・公開し、より高いデータ忠実度を実現する。
より正確なオプトイングループの推定値を優先する重み付き平均化メカニズムを用いて、両グループの推定値をブレンドする。
有用性を向上させるために、アプリケーション固有のローカルアルゴリズムを設計する。
分散とサンプルサイズに基づいてブレンド重みを最適化し、ヘッド検索ログの精度を最大化する。

実験結果

リサーチクエスチョン

RQ1ローカルモデルと信頼できるキュレーター・モデルを組み合わせることで、ユーザーのプライバシー保証を損なわずに有用性を向上させることができるか？
RQ2純粋にローカルまたはキュレーターに基づくアプローチと比較して、ハイブリッドモデルはプライベートなヘッド検索ログの構築においてどのように性能を発揮するか？
RQ3オプトイングループとクライアントグループのサイズを変化させた場合、ブレンド出力の有用性にどのような影響が生じるか？
RQ4ハイブリッドモデルは、ユーザー数が少ない組織における微分プライバシーの実用的導入を可能にするか？
RQ5誤差を最小限に抑えるとともに微分プライバシーの保証を維持するため、ブレンド処理をどのように最適化できるか？

主な発見

BLENDERは、1.75 GBおよび16 GBの検索クリックデータセットの両方において、さまざまなプライバシー予算下でNDCG値が95％を超える成果を達成した。
ブレンド機構は、オプトイングループの推定値の高い正確性を効果的に活用しつつ、すべてのユーザーのプライバシーを強く保証した。
ローカル検索ログ構築における有用性の観点で、[QYY+16]のような先行研究を著しく上回った。
サンプルサイズが小さいため、オプトイングループの推定値はやや変動が大きいが、適切に重み付けされた場合、ブレンドに有意義な貢献をする。
プライバシーを損なわず、有用性を向上させることで、ユーザー数が少ない組織における微分プライバシーの実用的導入を可能にした。
信頼に基づくデータ収集モデルを組み合わせることで、実世界の応用において顕著な有用性向上が達成できることを示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。