Skip to main content
QUICK REVIEW

[논문 리뷰] Differentially Private Obfuscation Mechanisms for Hiding Probability Distributions.

Yusuke Kawamoto, Takao Murakami|arXiv (Cornell University)|2018. 12. 03.
Privacy-Preserving Technologies in Data인용 수 9
한 줄 요약

이 논문은 확률 분포를 위한 국지적 차별적 비밀유지의 일종인 분포 비밀유지(distribution privacy)를 소개하고, 비밀유지-유용성 트레이드오프를 향상시키기 위해 무작위 가짜 데이터를 추가하는 새로운 왜곡 기법인 터플링 기법(tupling mechanism)을 제안한다. 실험 결과, 이 기법은 서비스 품질을 유지하면서도 위치기반 서비스에서 사용자 속성을 보호하는 데 기존의 국지적 기법들보다 뛰어난 성능을 보였다.

ABSTRACT

We introduce a formal model for the information leakage of probability distributions and define a notion called distribution privacy as the local differential privacy for probability distributions. Roughly, the distribution privacy of a local obfuscation mechanism means that the attacker cannot significantly gain any information on the distribution of the mechanism's input by observing its output. Then we show that existing local mechanisms can hide input distributions in terms of distribution privacy, while deteriorating the utility by adding too much noise. For example, we prove that the Laplace mechanism needs to add a large amount of noise proportionally to the infinite Wasserstein distance between the two distributions we want to make indistinguishable. To improve the tradeoff between distribution privacy and utility, we introduce a local obfuscation mechanism, called a tupling mechanism, that adds random dummy data to the output. Then we apply this mechanism to the protection of user attributes in location based services. By experiments, we demonstrate that the tupling mechanism outperforms popular local mechanisms in terms of attribute obfuscation and service quality.

연구 동기 및 목표

  • 확률 분포의 정보 泄露를 형식화하고, 국지적 왜곡 기법을 위한 비밀유지 보장으로서 분포 비밀유지를 정의하기.
  • 기존의 국지적 기법들(예: 라플라스 기법)이 분포 비밀유지를 달성하면서도 유용성을 유지하는 데에 한계를 보이는 이유를 규명하기.
  • 출력에 무작위 가짜 데이터를 추가하여 분포 비밀유지와 유용성 간의 트레이드오프를 향상시키는 새로운 왜곡 기법을 설계하기.
  • 위치기반 서비스에서 사용자 속성 보호의 맥락에서 제안된 기법을 평가하기.
  • 기존 방법들과 비교하여 더 강력한 비밀유지 보장을 제공하면서도 더 높은 서비스 품질을 유지할 수 있음을 입증하기.

제안 방법

  • 확률 분포의 정보 泄露를 측정하기 위한 형식적 모델을 제안하고, 분포 비밀유지를 국지적 차별적 비밀유지의 변종으로 정의한다.
  • 기존의 국지적 기법들(예: 라플라스 기법 등)을 분석하고, 분포 간 무한 대칭 거리(infinite Wasserstein distance)에 비례한 노이즈가 필요하다는 점을 보여 유용성이 떨어짐을 밝힌다.
  • 출력에 무작위 가짜 데이터를 주입함으로써 왜곡을 강화하는 터플링 기법을 도입한다.
  • 입력 분포가 사용자 이동 패턴을 나타내는 위치기반 서비스에서 사용자 속성을 보호하기 위해 터플링 기법을 적용한다.
  • 실험적 평가를 통해 표준 국지적 기법들과 비교하여 터플링 기법의 비밀유지 및 서비스 품질 측면에서의 성능을 분석한다.
  • 다양한 왜곡 기법 하에서 입력 분포의 구분 불가능성을 정량화하기 위해 워셔스타인 거리(Wasserstein distance)를 메트릭으로 사용한다.

실험 결과

연구 질문

  • RQ1국지적 환경에서 확률 분포의 왜곡에 대한 비밀유지 보장을 형식적으로 정의할 수 있는가?
  • RQ2기존의 국지적 왜곡 기법들(예: 라플라스 기법)이 입력 분포를 보호하기 위해 사용할 때, 얼마나 심각하게 유용성이 떨어지는가?
  • RQ3입력 분포의 비밀유지를 유지하면서 노이즈를 줄임으로써 비밀유지-유용성 트레이드오프를 향상시킬 수 있는 새로운 왜곡 기법을 설계할 수 있는가?
  • RQ4실제 응용 사례인 위치기반 서비스와 비교할 때 제안된 터플링 기법은 표준 기법들보다 어떻게 성능을 발휘하는가?
  • RQ5왜곡 출력에 가짜 데이터를 추가함으로써 사용자 속성 보호의 비밀유지 및 서비스 품질에 어떤 영향을 미치는가?

주요 결과

  • 라플라스 기법은 분포 간 무한 대칭 거리에 비례한 노이즈가 필요하여 심각한 유용성 손실이 발생한다.
  • 터플링 기법은 출력에 무작위 가짜 데이터를 추가함으로써 과도한 노이즈의 필요성을 줄이며 비밀유지-유용성 트레이드오프를 성공적으로 향상시킨다.
  • 실험 결과, 터플링 기법은 속성 왜곡과 서비스 품질 측면에서 기존의 인기 있는 국지적 기법들을 능가하는 성능을 보였다.
  • 제안된 기법은 위치기반 서비스의 정확성이나 사용성에 손상을 주지 않으면서도 더 강력한 분포 비밀유지를 달성한다.
  • 터플링 기법에서 가짜 데이터의 추가는 진짜 입력 분포를 효과적으로 가림으로써 공격자가 민감한 사용자 속성을 유추하기 어렵게 한다.
  • 이 기법은 복잡하거나 고차원적인 입력 분포(예: 사용자 이동 패턴)가 존재하는 환경에서 특히 효과적이다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.