QUICK REVIEW

[논문 리뷰] The Privacy Funnel from the viewpoint of Local Differential Privacy

Milan Lopuhaä-Zwakenberg|arXiv (Cornell University)|2020. 02. 04.

Educational Reforms and Innovations인용 수 4

한 줄 요약

이 논문은 개인정보 터널 프레임워크 하에서 데이터베이스 정제를 위한 로컬 정보 비밀유지(LIP)를 로컬 차별적 비밀유지(LDP)보다 우월한 대안으로 제안한다. 최적의 정제 프로토콜을 볼록 최적화 문제로 공식화함으로써, 저자들은 LIP가 특히 작은 비밀유지 예산에서 LDP보다 훨씬 빠른 계산 속도와 더 나은 비밀유지 목표와의 일치도를 제공함을 보여주며, 최악의 경우 비밀유지 보장을 유지하고 단일 및 다중 속성 환경 모두에서 양호한 유틸리티를 확보한다.

ABSTRACT

We consider a database $\vec{X} = (X_1,\cdots,X_n)$ containing the data of $n$ users. The data aggregator wants to publicise the database, but wishes to sanitise the dataset to hide sensitive data $S_i$ correlated to $X_i$. This setting is considered in the Privacy Funnel, which uses mutual information as a leakage metric. The downsides to this approach are that mutual information does not give worst-case guarantees, and that finding optimal sanitisation protocols can be computationally prohibitive. We tackle these problems by using differential privacy metrics, and by considering local protocols which operate on one entry at a time. We show that under both the Local Differential Privacy and Local Information Privacy leakage metrics, one can efficiently obtain optimal protocols; however, Local Information Privacy is both more closely aligned to the privacy requirements of the Privacy Funnel scenario, and more efficiently computable. We also consider the scenario where each user has multiple attributes (i.e. $X_i = (X^1_i,\cdots,X^m_i)$), for which we define \emph{Side-channel Resistant Local Information Privacy}, and we give efficient methods to find protocols satisfying this criterion while still offering good utility. Exploratory experiments confirm the validity of these methods.

연구 동기 및 목표

대규모 데이터베이스 공개에서 고전적 개인정보 터널 접근법의 계산 비가용성과 평균적 비밀유지 한계를 해결한다.
상호정보 유출을 더 강력한 최악의 경우 비밀유지 메트릭—특히 로컬 차별적 비밀유지(LDP)와 로컬 정보 비밀유지(LIP)—로 대체하여 모든 개인에 대해 강력한 보호를 보장한다.
LDP와 LIP 모두에 대해 최적의 정제 프로토콜을 효율적이고 확장 가능한 방법으로 계산하는 방법을 개발하며, 각 사용자 데이터에 독립적으로 작용하는 로컬 프로토콜에 중점을 둔다.
다중 속성 데이터를 위해 사이드채널에 저항하는 로컬 정보 비밀유지(SRLIP)를 도입함으로써, 속성 간 상관관계를 통한 누출을 방지한다.
다양한 비밀유지 메트릭과 데이터 설정에서 비밀유지, 유틸리티, 계산 효율성 간의 트레이드오프를 평가한다.

제안 방법

조건부 확률 분포 Q(y|x)의 공간에서 비밀유지 조건 ε-LIP 또는 ε-LDP를 충족하는 조건 하에 정제 문제를 볼록 최적화 작업으로 공식화한다.
선형 프로그래밍을 사용하여 ε-LIP 하에서 최적의 프로토콜을 계산하며, LIP 제약 조건이 LDP 제약 조건보다 정점 수가 적은 다면체를 정의한다는 사실을 활용한다.
다중 속성 데이터에 대해, 모든 속성 그룹에 대한 동시 제약 조건이 필요한 더 엄격한 비밀유지 조건인 ε-SRLIP를 정의한다.
변환된 다면체에서 정점 열거를 통해 ε-SRLIP 프로토콜을 계산하는 방법을 개발하지만, 이는 LIP보다 계산 비용이 더 높다.
다양한 비밀유지 예산과 속성 수를 가진 시뮬레이션 데이터에서 수치 실험을 통해 LIP와 LDP의 성능을 비교한다.
ε-LIP가 ε/2-LDP를 암시한다는 사실을 이용하여 LDP 프로토콜에 대한 유틸리티 하한을 유도함으로써 효율적인 근사 계산이 가능하도록 한다.

실험 결과

연구 질문

RQ1개인정보 터널 하에서 최적의 데이터베이스 정제를 위한 로컬 정보 비밀유지(LIP)가 로컬 차별적 비밀유지(LDP)보다 더 효율적이고 정확한 대안이 될 수 있는가?
RQ2특히 작은 비밀유지 예산에서 최적의 프로토콜을 찾는 데 있어 LIP와 LDP 간의 계산 복잡도는 어떻게 비교되는가?
RQ3LIP가 공동 분포 pS,X 가 알려진 개인정보 터널의 비밀유지 요구사항과 얼마나 잘 일치하는가?
RQ4사이드채널에 저항하는 더 강력한 비밀유지 메트릭인 사이드채널에 저항하는 로컬 정보 비밀유지(SRLIP)는 다중 속성 환경에서 효율적으로 계산될 수 있으며, 양호한 유틸리티를 유지할 수 있는가?
RQ5다중 속성 데이터 공개에서 SRLIP를 LIP 또는 LDP와 비교할 때, 비밀유지 강도, 계산 비용, 유틸리티 간의 트레이드오프는 어떠한가?

주요 결과

주어진 비밀유지 예산 ε에 대해, ε-LIP 하에서 최적의 정제 프로토콜은 ε-LDP 하에서보다 훨씬 더 빠르게 계산될 수 있으며, ε 값이 작을수록 이 속도 우위가 커진다.
ε-LIP 하에서의 최적 유틸리티는 항상 ε-LDP 하에서의 유틸리티보다 높으며, 상호정보량 I(X;Y)의 차이는 비록 LIP가 더 엄격한 비밀유지 메트릭이지만 일반적으로 5% 이하로 작다.
ε-LIP와 ε/2-LDP를 비교했을 때, LIP 프로토콜은 더 높은 유틸리티를 달성하고 훨씬 더 빠르게 계산되며, 모든 테스트된 ε 값에서 유틸리티 갭이 낮게 유지된다.
다중 속성 데이터에 대해, 정리 2(ε-LIP용) 기반 방법은 정리 3(ε-SRLIP용) 기반 방법보다 평균적으로 476배 빠르지만, 후자는 더 강력한 비밀유지 보장을 제공한다.
ε-SRLIP 하에서의 유틸리티 손실은 측정 가능하지만 수용 가능하며, 사이드채널 공격에 대해 여전히 강건하므로 민감한 다중 속성 환경에서의 사용이 정당화된다.
ε가 증가함에 따라 LIP와 LDP 간 성능의 차이가 줄어들며, 더 많은 프로토콜이 둘 다를 충족하게 되어 다면체가 유사해지고, 결과적으로 계산 시간과 유틸리티도 유사해진다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.