QUICK REVIEW

[논문 리뷰] Restricted Local Differential Privacy for Distribution Estimation with High Data Utility.

Takao Murakami, Yusuke Kawamoto|arXiv (Cornell University)|2018. 07. 30.

Privacy-Preserving Technologies in Data참고 문헌 29인용 수 4

한 줄 요약

이 논문은 민감도가 높은 데이터에 대해 강력한 프라이버시를 유지하면서 비민감 데이터에 대한 노이즈를 줄이는 유틸리티 최적화 국지적 차별적 프라이버시(ULDP)라는 새로운 프레임워크를 소개한다. 이는 표준 LDP 메커니즘보다 훨씬 높은 데이터 유틸리티를 달성하며, 특히 대부분의 데이터가 비민감한 경우 비프라이버시 유틸리티에 가까워진다.

ABSTRACT

LDP (Local Differential Privacy) has been widely studied to estimate statistics of personal data (e.g., distribution underlying the data) while protecting users' privacy. Although LDP does not require a trusted third party, it regards all personal data equally sensitive, which causes excessive obfuscation hence the loss of utility. In this paper, we introduce the notion of ULDP (Utility-optimized LDP), which provides a privacy guarantee equivalent to LDP only for sensitive data. We first consider the setting where all users use the same obfuscation mechanism, and propose two mechanisms providing ULDP: utility-optimized randomized response and utility-optimized RAPPOR. We then consider the setting where the distinction between sensitive and non-sensitive data can be different from user to user. For this setting, we propose a personalized ULDP mechanism with semantic tags to estimate the distribution of personal data with high utility while keeping secret what is sensitive for each user. We show theoretically and experimentally that our mechanisms provide much higher utility than the existing LDP mechanisms when there are a lot of non-sensitive data. We also show that when most of the data are non-sensitive, our mechanisms even provide almost the same utility as non-private mechanisms in the low privacy regime.

연구 동기 및 목표

표준 국지적 차별적 프라이버시(LDP)의 비효율성을 해결하기 위해, 민감도에 관계없이 모든 데이터에 동일한 노이즈를 적용함으로써 과도한 유틸리티 손실이 발생하는 문제를 해결한다.
민감도가 높은 데이터에 대해서만 강력한 프라이버시 보장을 유지하면서 비민감 데이터에 대한 왜곡을 최소화하는 메커니즘을 설계한다.
사용자가 자신의 민감한 데이터를 정의할 수 있도록 개인화된 프라이버시 보호를 가능하게 하여, 프라이버시를 훼손하지 않으면서 유틸리티를 향상시킨다.
이론적 및 실증적 분석을 통해 ULDP가 기존 LDP 메커니즘보다 높은 유틸리티를 달성함을 입증한다. 특히 대부분의 데이터가 비민감한 경우에 두드러진다.

제안 방법

민감도에 따라 노이즈 주입을 조정하는 유틸리티 최적화 랜덤라이즈드 리스폰스를 제안하여, 비민감 데이터에 대한 유틸리티를 향상시킨다.
유틸리티 최적화 RAPPOR을 도입하여, 민감도가 높은 데이터의 프라이버시를 유지하면서도 유틸리티를 향상시키는 오브퓨케이션 프로세스를 최적화한다.
사용자가 개별적으로 민감도를 표시할 수 있도록 의미적 태그를 사용하는 개인화된 ULDP 메커니즘을 설계하여, 사용자별 노이즈 할당을 가능하게 한다.
민감도가 높은 데이터에만 높은 프라이버시 보호를 할당하는 프라이버시 예산 할당 전략을 적용하여 총 노이즈를 감소시킨다.
비민감 데이터의 구조를 활용하는 분포 추정 프레임워크를 적용하여 추정 정확도를 향상시킨다.
이론적 분석과 실증 평가를 통해 다양한 민감도 비율에서 표준 LDP 메커니즘과의 유틸리티를 비교한다.

실험 결과

연구 질문

RQ1민감도가 높은 데이터에 대해 강력한 프라이버시를 유지하면서 비민감 데이터에 대한 노이즈를 줄이는 국지적 차별적 프라이버시 메커니즘을 설계할 수 있는가?
RQ2비민감 데이터 비율이 높을 경우 ULDP의 유틸리티는 표준 LDP 메커니즘과 어떻게 비교되는가?
RQ3개인화된 민감도 레이블링이 프라이버시 보장을 악화시키지 않고 데이터 유틸리티를 향상시킬 수 있는가?
RQ4저프라이버시 환경에서 ULDP는 비프라이버시 메커니즘의 유틸리티에 얼마나 가까이 접근할 수 있는가?

주요 결과

대부분의 데이터가 비민감한 경우 ULDP 메커니즘은 표준 LDP 메커니즘보다 훨씬 높은 유틸리티를 달성한다.
저프라이버시 환경에서 대부분의 데이터가 비민감한 경우 ULDP는 비프라이버시 메커니즘의 유틸리티에 가까워진다.
의미적 태그를 사용한 개인화된 ULDP 메커니즘은 정교한 프라이버시 제어를 가능하게 하며, 높은 추정 정확도를 유지한다.
유틸리티 최적화 랜덤라이즈드 리스폰스와 RAPPOR은 비민감 데이터에 대한 노이즈를 감소시켜 분포 추정 성능을 향상시킨다.
이론적 및 실험적 결과는 ULDP가 민감도가 높은 데이터에 대해서만 LDP와 동일한 프라이버시 보장을 제공하며, 전체 프라이버시 보장에 영향을 주지 않음을 확인한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.