Skip to main content
QUICK REVIEW

[논문 리뷰] On the Power of Multiple Anonymous Messages

Badih Ghazi, Noah Golowich|arXiv (Cornell University)|2019. 08. 29.
Privacy-Preserving Technologies in Data참고 문헌 93인용 수 23
한 줄 요약

이 논문은 비차별적 프라이버시의 분산 모델에서 빈도 추정 및 관련 문제에 대한 기본 한계와 효율적인 프로토콜을 설정한다. 다중 메시지 사용자가 단일 메시지 프로토콜보다 오차를 지수적으로 줄일 수 있음을 증명하며, 다항로그 오차와 통신량을 달성하고, 단일 메시지 설정에 대해 거의 날카로운 하한을 제공한다.

ABSTRACT

An exciting new development in differential privacy is the shuffled model, in which an anonymous channel enables non-interactive, differentially private protocols with error much smaller than what is possible in the local model, while relying on weaker trust assumptions than in the central model. In this paper, we study basic counting problems in the shuffled model and establish separations between the error that can be achieved in the single-message shuffled model and in the shuffled model with multiple messages per user. For the problem of frequency estimation for $n$ users and a domain of size $B$, we obtain: - A nearly tight lower bound of $ ildeΩ( \min(\sqrt[4]{n}, \sqrt{B}))$ on the error in the single-message shuffled model. This implies that the protocols obtained from the amplification via shuffling work of Erlingsson et al. (SODA 2019) and Balle et al. (Crypto 2019) are essentially optimal for single-message protocols. A key ingredient in the proof is a lower bound on the error of locally-private frequency estimation in the low-privacy (aka high $ε$) regime. - Protocols in the multi-message shuffled model with $poly(\log{B}, \log{n})$ bits of communication per user and $poly\log{B}$ error, which provide an exponential improvement on the error compared to what is possible with single-message algorithms. For the related selection problem on a domain of size $B$, we prove: - A nearly tight lower bound of $Ω(B)$ on the number of users in the single-message shuffled model. This significantly improves on the $Ω(B^{1/17})$ lower bound obtained by Cheu et al. (Eurocrypt 2019), and when combined with their $ ilde{O}(\sqrt{B})$-error multi-message protocol, implies the first separation between single-message and multi-message protocols for this problem.

연구 동기 및 목표

  • 분산 모델에서 다중 익명 메시지의 능력을 이해하기 위해.
  • 빈도 추정 및 선택 문제에서 단일 메시지 프로토콜의 오차에 대해 날카로운 하한을 설정하기 위해.
  • 빈도 추정, 범위 카운팅, M-추정과 같은 기본 문제에 대해 다항로그 오차와 통신량을 갖는 효율적인 다중 메시지 프로토콜을 설계하기 위해.
  • 달성 가능한 오차 측면에서 단일 메시지 프로토콜과 다중 메시지 프로토콜 사이의 증명 가능한 분리 현상을 보여주기 위해.
  • 이전 연구의 한계를 극복하기 위해 국소 프라이버시 빈도 추정 기법을 고프라이버시(낮은 ε) 영역으로 확장하기 위해.

제안 방법

  • 낮은 프라이버시 영역에서 국소 프라이버시 빈도 추정을 위한 새로운 기법을 사용하여, 단일 메시지 분산 모델에서 오차에 대해 거의 날카로운 하한 $\tilde{\Omega}(\min(\sqrt[4]{n}, \sqrt{B}))$ 을 유도한다.
  • 각 사용자당 $\mathrm{poly}(\log B, \log n)$ 통신량과 $\mathrm{poly}\log B$ 오차를 갖는 빈도 추정을 위한 비밀 코인 다중 메시지 프로토콜을 도입한다.
  • 효율적인 데이터 구조와 분산을 활용하여 빠른 쿼리 시간을 갖는 공개 코인 프로토콜을 개발하여 범위 카운팅을 위한 것이다.
  • 도메인을 $B = n$ 개의 간격으로 이산화하여 중앙값과 분위수의 M-추정을 범위 카운팅으로 환원한다.
  • 다차원 범위 카운팅을 단일 차원 쿼리로 환원하기 위해 행렬 기법을 적용하고, 비차별적 프라이버시 보장을 확보한다.
  • 분산 모델의 익명화 기능을 활용하여, 국소 모델보다 오차가 훨씬 작은 비상호작용적, 비차별적 프라이버시 프로토콜을 가능하게 한다.

실험 결과

연구 질문

  • RQ1단일 메시지 분산 모델에서 빈도 추정의 기본 오차 한계는 무엇인가?
  • RQ2분산 모델에서 사용자가 다중 메시지를 사용할 경우 단일 메시지 프로토콜보다 오차를 지수적으로 줄일 수 있는가?
  • RQ3단일 메시지 분산 모델에서 선택 문제를 해결하기 위해 필요한 최소 사용자 수는 얼마인가?
  • RQ4중앙값과 분위수의 M-추정은 다중 메시지 분산 모델에서 어떻게 효율적으로 해결할 수 있는가?
  • RQ5국소 프라이버시 빈도 추정 기법은 고프라이버시 영역을 초월하여 확장될 수 있는가?

주요 결과

  • 단일 메시지 분산 모델에서 빈도 추정에 대해 오차에 대해 거의 날카로운 하한 $\tilde{\Omega}(\min(\sqrt[4]{n}, \sqrt{B}))$ 이 확립되었다.
  • Erlingsson 등 (SODA 2019)과 Balle 등 (Crypto 2019)의 프로토콜이 단일 메시지 설정에서 본질적으로 최적이 됨을 입증했다.
  • 각 사용자당 $\mathrm{poly}(\log B, \log n)$ 통신량과 $\mathrm{poly}\log B$ 오차를 갖는 다중 메시지 프로토콜이 빈도 추정을 위해 구축되었다.
  • 선택 문제에 대해 단일 메시지 모델에서 $\Omega(B)$ 명의 사용자가 필요함을 증명하였으며, 이는 이전의 $\Omega(B^{1/17})$ 하한보다 크게 향상된 것이다.
  • 선택 문제에 대해 단일 메시지 프로토콜과 다중 메시지 프로토콜 사이의 첫 번째 증명 가능한 분리를 확립했다.
  • 이산화를 통한 범위 카운팅으로 환원함으로써, 각 사용자당 $\mathrm{poly}\log n$ 오차와 통신량을 갖는 중앙값에 대한 비차별적 프라이버시 다중 메시지 프로토콜을 달성했다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.