QUICK REVIEW

[論文レビュー] Generating Optimal Privacy-Protection Mechanisms via Machine Learning

Marco Romanelli, Catuscia Palamidessi|arXiv (Cornell University)|Apr 1, 2019

Privacy-Preserving Technologies in Data参考文献 26被引用数 10

ひとこと要約

本論文は、特に位置情報のような機微なデータのための最適なプライバシー保護型隠し方を生成する、GANにインspiredされた機械学習フレームワークを提案する。生成器がデータを隠し、分類器がその復元を試みる敵対的訓練を通じて、低バイアス誤差と従来の平面ラプラス機構に比べて優れたプライバシー・ユーティリティトレードオフを達成し、強力なプライバシー保護を実現する。

ABSTRACT

We consider the problem of obfuscating sensitive information while preserving utility. Given that an analytical solution is often not feasible because of un-scalability and because the background knowledge may be too complicated to determine, we propose an approach based on machine learning, inspired by the GANs (Generative Adversarial Networks) paradigm. The idea is to set up two nets: the generator, that tries to produce an optimal obfuscation mechanism to protect the data, and the classifier, that tries to de-obfuscate the data. By letting the two nets compete against each other, the mechanism improves its degree of protection, until an equilibrium is reached. We apply our method to the case of location privacy, and we perform experiments on synthetic data and on real data from the Gowalla dataset. We evaluate the privacy of the mechanism not only by its capacity to defeat the classificator, but also in terms of the Bayes error, which represents the strongest possible adversary. We compare the privacy-utility tradeoff of our method with that of the planar Laplace mechanism used in geo-indistinguishability, showing favorable results.

研究の動機と目的

複雑な背景知識がある場合、解析的解法が不適切となるようなスケーラブルで最適なプライバシー機構の設計という課題に対処すること。
敵対的訓練を活用することで、特に位置データのような機微なデータのプライバシー保護を向上させること。
生成器と分類器のネットワーク間の競争を通じて隠し方機構を最適化することで、望ましいプライバシー・ユーティリティトレードオフを達成すること。
訓練済みの分類器に加え、理論的に最も強い敵対者に対しても耐性を示すプライバシーの強度を、ベイズ誤差によって測定すること。

提案手法

フレームワークは2つのニューラルネットワークを採用する：データを隠す生成器と、元のデータを復元しようとする分類器。
生成器と分類器は敵対的に訓練され、生成器は分類器を欺けるように隠し方を改善する。
均衡に達するまで訓練を継続し、その時点で生成器は脱匿名化に対して最大限に耐性を持つ隠し方を生成する。
プライバシーはベイズ誤差を用いて評価され、任意の敵対者にとっての最小誤差率を表し、最も強力な攻撃に対しても耐性があることを保証する。
性能の妥当性を検証するため、合成データおよび実世界のGowallaデータを用いて位置プライバシーに適用する。
プライバシー・ユーティリティトレードオフは、ジオインダイストルケーション分野の標準である平面ラプラス機構と比較される。

実験結果

リサーチクエスチョン

RQ1解析的解法に比べてプライバシー・ユーティリティトレードオフにおいて優れた隠し方機構を機械学習ベースのアプローチが生成できるか？
RQ2生成器と分類器の間の敵対的訓練は、頑健なプライバシー保護型隠し方を生成するのにどの程度効果的か？
RQ3ベイズ誤差によって測定した場合、提案手法はどの程度、理論的に最も強い敵対者に対して耐性を示すか？
RQ4実世界の位置データにおいて、提案手法のプライバシー・ユーティリティトレードオフは平面ラプラス機構と比べてどの程度優れているか？

主な発見

提案手法は平面ラプラス機構よりも低いベイズ誤差を達成しており、最も強い敵対者に対しても強い耐性があることを示している。
敵対的訓練フレームワークは、高いデータユーティリティを維持しながらも、強力なプライバシー保証を提供する隠し方機構を効果的に生成した。
合成データおよび実際のGowallaデータの両方において、平面ラプラス機構に比べて望ましいプライバシー・ユーティリティトレードオフを示した。
GANに類似した訓練プロセスで達成された均衡状態は、複雑な背景知識があっても、頑健でスケーラブルな隠し方機構をもたらした。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。