Skip to main content
QUICK REVIEW

[논문 리뷰] Differentially Private Summation with Multi-Message Shuffling

Borja Balle, James Bell|arXiv (Cornell University)|2019. 06. 20.
Privacy-Preserving Technologies in Data참고 문헌 7인용 수 27
한 줄 요약

이 논문은 비밀보장된 섞기 모델에서 실수 합산 프로토콜을 제안하며, $O_{\epsilon,\delta}(1)$ 오차와 $O_{\epsilon,\delta}(\log n)$ 메시지(크기 $O(\log n)$)를 달성한다. 이는 안전한 섞기와 기하분포의 무한가소성의 특성을 활용한다. 기존의 작업에 비해 오차에서 $\delta$-의존성과 통신 복잡도에서 $\epsilon$-의존성을 제거함으로써 향상된다.

ABSTRACT

In recent work, Cheu et al. (Eurocrypt 2019) proposed a protocol for $n$-party real summation in the shuffle model of differential privacy with $O_{ε, δ}(1)$ error and $Θ(ε\sqrt{n})$ one-bit messages per party. In contrast, every local model protocol for real summation must incur error $Ω(1/\sqrt{n})$, and there exist protocols matching this lower bound which require just one bit of communication per party. Whether this gap in number of messages is necessary was left open by Cheu et al. In this note we show a protocol with $O(1/ε)$ error and $O(\log(n/δ))$ messages of size $O(\log(n))$ per party. This protocol is based on the work of Ishai et al.\ (FOCS 2006) showing how to implement distributed summation from secure shuffling, and the observation that this allows simulating the Laplace mechanism in the shuffle model.

연구 동기 및 목표

  • 실수 합산에 대해 국소 모델과 섞기 모델 간의 통신 복잡도 격차를 해소하기 위해.
  • 참여자 수에 대해 비선형 통신 복잡도를 갖는 프로토콜을 설계하여 일정한 오차를 달성하기 위해.
  • 기존 섞기 모델 프로토콜을 향상시켜 오차 및 통신 복잡도의 $\epsilon$ 및 $\delta$ 의존성을 줄이기 위해.
  • 기하분포의 무한가소성을 활용하여 섞기 모델에서 효율적인 노이즈 집계를 수행하기 위해.

제안 방법

  • 정밀도 $p$를 갖는 고정소수점 표현을 사용한 실수의 인코딩 후, 무작위 반올림을 통해 실수 값을 정수 메시지로 변환한다.
  • Ishai 등 (FOCS 2006)의 보안 섞기 원리를 기반으로 한 안전한 섞기 원리를 활용해 섞기 모델에서 라플라스 메커니즘을 적용함으로써 분산 합산과 개인정보 보호를 동시에 달성한다.
  • Goryczka와 Xiong의 제안에 따라 기하분포의 무한가소성에 기반한 분산 노이즈 집계 기법을 적용한다.
  • 통계적 거리와 결합을 통한 분석을 통해 개인정보 泄露를 제한하며, 출력의 균일성을 확보하기 위해 잔여 해시 렘마를 활용한다.
  • 각 당사자당 메시지 수를 $k = \lceil \frac{5}{2}\log q + \sigma + \frac{1}{4}\log(\log q + \sigma) + \log(n-1) \rceil$로 설정하여 $\delta$-독립적 오차를 확보한다.
  • 통계적 거리 분석을 통해 분석자의 시야가 비밀보장된 메커니즘과 가까워지며, 이는 $(\epsilon,\delta)$-비밀보장성의 보장을 이끈다.

실험 결과

연구 질문

  • RQ1섞기 모델에서 실수 합산을 위한 프로토콜이 참여자당 $o(\sqrt{n})$의 통신으로 $O(1)$ 오차를 달성하면서도 개인정보 보호를 유지할 수 있는가?
  • RQ2이러한 프로토콜에서 오차의 $\delta$-의존성과 통신 복잡도의 $\epsilon$-의존성을 제거하는 것이 가능한가?
  • RQ3기하분포의 무한가소성을 활용하여 섞기 모델에서 더 효율적인 노이즈 집계 기법을 설계할 수 있는가?
  • RQ4비밀보장된 합산에서 일정한 오차를 달성하기 위해 필요한 최소한의 메시지 수는 얼마인가?
  • RQ5개인정보 보장을 유지하기 위해 메시지 수가 $n$에 따라 증가해야 하는가, 아니면 일정한 수로 충분한가?

주요 결과

  • 프로토콜은 당사자당 $O_{\epsilon,\delta}(1)$의 오차와 $O_{\epsilon,\delta}(\log n)$의 메시지를 달성하여 Cheu 등이 제안한 $\Theta(\epsilon\sqrt{n})$의 메시지 복잡도를 초월한다.
  • 오차는 $\delta$에 영향을 받지 않으며, Ghazi 등과의 동시 작업 대비 $O(\sqrt{\log(1/\delta)})$의 요소를 절감한다.
  • 통신 복잡도는 $\epsilon$에 영향을 받지 않으며, Ghazi 등과의 비교에서 메시지 수의 $O(\log(1/\epsilon))$ 요소를 절감한다.
  • 기하분포의 무한가소성을 활용하여 효율적이고 비밀보장된 노이즈 집계를 가능하게 하여 다른 기법에 의존하지 않도록 한다.
  • 분석 결과, $k = \lceil \frac{5}{2}\log q + \sigma + \frac{1}{4}\log(\log q + \sigma) + \log(n-1) \rceil$의 메시지 수로도 $\delta$-독립적 개인 정보 보호를 확보할 수 있음을 입증한다.
  • 결합 분석과 통계적 거리 기반 분석을 통해 프로토콜이 비밀보장됨을 증명하였으며, 최종 개인 정보 보호 보장은 렘마 1.2로부터 유도된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.