QUICK REVIEW

[논문 리뷰] Separating Local & Shuffled Differential Privacy via Histograms

Victor Balcer, Albert Cheu|arXiv (Cornell University)|2020. 01. 01.

Privacy-Preserving Technologies in Data참고 문헌 20인용 수 10

한 줄 요약

이 논문은 데이터 도메인 크기와 무관한 오차를 갖는 히스토그램 추정을 위한 새로운 셔플링 기반 프로토콜을 제안하며, 셔플링 모델과 로컬 차별적 프라이버시 모델 간의 샘플 복잡도에 대해 임의로 큰 격리가 있음을 입증한다. 주요 기여는 셔플링 모델에서 동 同 시 오차 O(log(1/δ)/(ε²n))를 달성하는 프로토콜를 제안한 것으로, 이는 로컬 모델에서의 Ω(√log d/(ε√n))과 대비된다. 또한 순수 차별적 프라이버시가 단일 메시지 프로토콜에서 셔플링 모델을 로컬 모델로 축소시킴을 증명한다.

ABSTRACT

Recent work in differential privacy has highlighted the shuffled model as a promising avenue to compute accurate statistics while keeping raw data in users' hands. We present a protocol in this model that estimates histograms with error independent of the domain size. This implies an arbitrarily large gap in sample complexity between the shuffled and local models. On the other hand, we show that the models are equivalent when we impose the constraints of pure differential privacy and single-message randomizers.

연구 동기 및 목표

셔플링 모델과 로컬 모델 간의 정확도 격리 여부를 조사한다.
도메인 크기와 무관한 오차를 갖는 셔플링 모델 내 히스토그램 추정 프로토콜를 설계한다.
로컬 모델과 셔플링 모델 간의 샘플 복잡도에 대한 정량적 분리를 수립한다.
순수 차별적 프라이버시 제약 조건 하에서 셔플링 모델의 한계를 탐색한다.
순수 차별적 프라이버시가 단일 메시지 셔플링 프로토콜에서 로컬 프로토콜과 동일하게 작용함을 보여준다.

제안 방법

조정된 노이즈를 갖는 랜덤라이즈드 리스폰스를 사용하여 셔플링 기반의 히스토그램 추정을 위한 새로운 프로토콜를 도입한다.
사용자 메시지를 익명화하기 위해 사전 셔플링 메커니즘을 활용하여 더 강력한 프라이버시 보장을 가능하게 한다.
모든 히스토그램 박스에서의 동 시 오차를 제한하기 위해 메시지 분포의 통계 분석을 수행한다.
포인터 추적 및 다중 당사자 포인터 점프 문제에서의 감소를 적용하여 샘플 복잡도 하한을 확립한다.
순수 차별적 프라이버시에서, 모든 단일 메시지 셔플링 프로토콜은 동일한 프라이버시 및 정확도를 갖는 로컬 프로토콜로 시뮬레이션 가능함을 증명한다.
셔플링에 의한 강화 레마와 통계적 거리 분석을 활용하여 프라이버시 및 정확도 하한을 유도한다.

실험 결과

연구 질문

RQ1셔플링 모델 내에서 히스토그램 추정은 도메인 크기 d에 영향을 받지 않는 오차를 달성할 수 있는가?
RQ2분포 추정에 있어 로컬 모델과 셔플링 모델 간의 정량적 샘플 복잡도 격리는 무엇인가?
RQ3정확도 및 샘플 효율성 측면에서 셔플링 모델은 로컬 모델보다 유의미한 이점을 제공하는가?
RQ4어떤 조건에서 셔플링 모델은 프라이버시 및 정확도 측면에서 로컬 모델로 축소되는가?
RQ5단일 메시지 셔플링 프로토콜에서 순수 차별적 프라이버시는 정확도나 프라이버시 손실 없이 로컬 프로토콜로 시뮬레이션 가능한가?

주요 결과

제안된 프로토콜은 셔플링 모델에서 도메인 크기 d와 무관하게 동 시 오차 O(log(1/δ)/(ε²n))를 달성한다.
log(1/δ) = o(log d)일 경우 기존 작업보다 엄격히 작은 오차 하한을 갖는다. 특히 브라우저 홈피와 같은 대규모 도메인 환경에서 유의미하다.
셔플링 모델의 샘플 복잡도는 문제 매개변수에 영향을 받지 않을 수 있지만, 로컬 모델의 경우 이러한 매개변수에 따라 증가하므로, 임의로 큰 분리가 가능함을 입증한다.
순수 차별적 프라이버시에서, 모든 단일 메시지 셔플링 프로토콜은 동일한 프라이버시 및 샘플 복잡도 보장을 갖는 로컬 프로토콜로 시뮬레이션 가능하다.
논문은 다중 메시지 셔플링 프로토콜이 랜덤라이저가 비차별적일지라도 ε-차별적 프라이버시를 갖을 수 있음을 보여주는 반례를 구성한다. 이는 프라이버시 강화가 랜덤라이저 수준까지 확장되지 않음을 시사한다.
포인터 추적 문제에 대해 비상호작용 로컬 프로토콜의 하한 Ω(ℓ/eε)을 도출하여, 비상호작용 로컬 모델과 셔플링 모델 간에 임의로 큰 분리를 입증한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.