QUICK REVIEW

[논문 리뷰] Generating Optimal Privacy-Protection Mechanisms via Machine Learning

Marco Romanelli, Catuscia Palamidessi|arXiv (Cornell University)|2019. 04. 01.

Privacy-Preserving Technologies in Data참고 문헌 26인용 수 10

한 줄 요약

이 논문은 민감한 데이터, 특히 위치 데이터에 대해 최적의 프라이버시 보호 오버클로징 메커니즘을 생성하기 위해 GAN 기반의 기계학습 프레임워크를 제안한다. 생성자 모델이 데이터를 오버클로징하고 분류기 모델이 이를 복원하려는 적대적 훈련을 통해 강력한 프라이버시 보호를 달성하였으며, 계획형 라플라스 메커니즘과 비교해 낮은 베이즈 오차와 유리한 프라이버시-유용성 트레이드오프를 입증하였다.

ABSTRACT

We consider the problem of obfuscating sensitive information while preserving utility. Given that an analytical solution is often not feasible because of un-scalability and because the background knowledge may be too complicated to determine, we propose an approach based on machine learning, inspired by the GANs (Generative Adversarial Networks) paradigm. The idea is to set up two nets: the generator, that tries to produce an optimal obfuscation mechanism to protect the data, and the classifier, that tries to de-obfuscate the data. By letting the two nets compete against each other, the mechanism improves its degree of protection, until an equilibrium is reached. We apply our method to the case of location privacy, and we perform experiments on synthetic data and on real data from the Gowalla dataset. We evaluate the privacy of the mechanism not only by its capacity to defeat the classificator, but also in terms of the Bayes error, which represents the strongest possible adversary. We compare the privacy-utility tradeoff of our method with that of the planar Laplace mechanism used in geo-indistinguishability, showing favorable results.

연구 동기 및 목표

복잡한 배경 지식으로 인해 분석적 해법이 불가능한 상황에서 스케일러블하고 최적의 프라이버시 메커니즘을 설계하는 데 도전한다.
적대적 훈련을 활용하여 민감한 데이터, 특히 위치 데이터의 프라이버시 보호를 향상시킨다.
생성자와 분류기 네트워크 간의 경쟁을 통해 오버클로징 메커니즘을 최적화하여 유리한 프라이버시-유용성 트레이드오프를 달성한다.
훈련된 분류기 외에도 이론적으로 가장 강력한 적대자에 대한 프라이버시 강건성을 평가하며, 베이즈 오차로 측정한다.

제안 방법

프레임워크는 오버클로징된 데이터를 생성하는 생성자와 원본 데이터를 복원하려는 시도를 하는 분류기 두 개의 신경망을 사용한다.
생성자와 분류기는 적대적으로 훈련되며, 생성자는 분류기를 속이기 위해 오버클로징을 개선한다.
균형 상태에 도달할 때까지 훈련 과정이 지속되며, 이때 생성자는 탈식별이 최대한 어려운 오버클로징을 생성한다.
프라이버시는 베이즈 오차를 통해 평가되며, 이는 어떤 적대자라도 달성할 수 있는 최소 오차율을 나타내어 가장 강력한 공격에 대한 강건성을 보장한다.
성능 검증을 위해 합성 데이터와 실제 Gowalla 데이터를 사용하여 위치 프라이버시에 적용하였다.
프라이버시-유용성 트레이드오프는 지오-불변성 기준으로 널리 사용되는 계획형 라플라스 메커니즘과 비교하였다.

실험 결과

연구 질문

RQ1기계학습 기반 접근 방식이 분석적 해법보다 프라이버시-유용성 트레이드오프에서 뛰어난 오버클로징 메커니즘을 생성할 수 있는가?
RQ2생성자와 분류기 간의 적대적 훈련이 강력한 프라이버시 보존 오버클로징을 생성하는 데 얼마나 효과적인가?
RQ3베이즈 오차로 측정했을 때, 제안된 방법이 이론적으로 가장 강력한 적대자에 대해 어느 정도 저항력을 가지는가?
RQ4실제 위치 데이터에서 제안된 방법의 프라이버시-유용성 트레이드오프는 계획형 라플라스 메커니즘과 비교해 어떻게 되는가?

주요 결과

제안된 방법은 계획형 라플라스 메커니즘보다 낮은 베이즈 오차를 기록하여 가장 강력한 가능한 적대자에 대한 저항력이 뛰어나다는 것을 나타낸다.
적대적 훈련 프레임워크는 높은 데이터 유용성을 유지하면서도 강력한 프라이버시 보장을 제공하는 오버클로징 메커니즘을 성공적으로 생성하였다.
합성 데이터 및 실제 Gowalla 데이터 양쪽 모두에서, 계획형 라플라스 메커니즘과 비교해 더 유리한 프라이버시-유용성 트레이드오프를 보였다.
GAN 유사한 훈련 과정에서 도달한 균형 상태는 복잡한 배경 지식이 존재하는 상황에서도 강건하고 확장 가능한 오버클로징 메커니즘을 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.