QUICK REVIEW

[논문 리뷰] Individual Privacy Accounting via a Renyi Filter

Vitaly Feldman, Tijana Zrnic|arXiv (Cornell University)|2020. 08. 25.

Privacy-Preserving Technologies in Data참고 문헌 31인용 수 21

한 줄 요약

이 논문은 각 데이터 포인트별 개인별 개인정보 유출 손실을 추적하는 데 사용되는 레니 미분 개인 정보 보호 필터를 도입하여, 적응형 데이터 분석에서 더 날카운트한 개인정보-유용성 트레이드오프를 가능하게 한다. 개인의 개인정보 예산을 초과하는 사람들을 동적으로 제외함으로써, 개인정보 보장을 해치지 않으면서도 특히 하이퍼파라미터가 최적화되지 않은 경우에도 유용성을 향상시킨다.

ABSTRACT

We consider a sequential setting in which a single dataset of individuals is used to perform adaptively-chosen analyses, while ensuring that the differential privacy loss of each participant does not exceed a pre-specified privacy budget. The standard approach to this problem relies on bounding a worst-case estimate of the privacy loss over all individuals and all possible values of their data, for every single analysis. Yet, in many scenarios this approach is overly conservative, especially for "typical" data points which incur little privacy loss by participation in most of the analyses. In this work, we give a method for tighter privacy loss accounting based on the value of a personalized privacy loss estimate for each individual in each analysis. To implement the accounting method we design a filter for Rényi differential privacy. A filter is a tool that ensures that the privacy parameter of a composed sequence of algorithms with adaptively-chosen privacy parameters does not exceed a pre-specified budget. Our filter is simpler and tighter than the known filter for $(ε,δ)$-differential privacy by Rogers et al. We apply our results to the analysis of noisy gradient descent and show that personalized accounting can be practical, easy to implement, and can only make the privacy-utility tradeoff tighter.

연구 동기 및 목표

모든 개인이 최악의 경우 개인정보 손실을 겪는다고 가정하는 표준 개인 정보 보호 조합 정리의 과도한 보수성 문제를 해결한다.
적응형 분석 중에 각 개인의 개인정보 손실을 추정하고 추적함으로써 더 날카운트한 개인정보 회계를 가능하게 한다.
실제 환경에서 하이퍼파라미터가 최적화되지 않은 경우에도 성능을 향상시킬 수 있는 실용적이고 구현 가능한 개인화된 개인정보 예산 설정 방법을 개발한다.
개인화된 회계가 개인 정보 보호 최적화에서 상당한 정확도 향상을 이끌 수 있음을 입증한다. 특히 모델 하이퍼파라미터가 최적화되지 않은 경우에 두드러진다.

제안 방법

각 개인에 대해, 알고리즘이 한 개인의 데이터가 포함된 데이터셋과 그를 제외한 데이터셋에 적용되었을 때의 출력 분포 간 레니 발산을 계산하여 개인별 개인정보 손실 추정치를 제안한다.
각 개인의 누적 개인정보 손실이 적응형 조합 전반에 걸쳐 사전에 정해진 예산 내에 머무르도록 보장하는 레니 개인 정보 보호 필터를 설계한다.
예상 개인정보 손실이 남은 예산을 초과하는 데이터 포인트를 동적으로 제외하여, 이후 분석에 참여할 수 있는 활성 포인트만 유지한다.
기울기 노름과 노이즈 주입 기반으로 각 데이터 포인트별로 개인정보 예산을 추적하는, 개인 정보 보호 기반 확률적 경사 하강법(DP-SGD)에 이 방법을 적용한다.
기존의 (ε,δ)-개인정보 보호보다 더 날카운트한 조합 한계를 허용하는 레니 개인 정보 보호(RDP)를 사용하여 필터를 구현한다. 특히 적응형 설정에서 유리하다.
클리핑 및 노이즈 수준을 각 데이터 포인트별로 조정함으로써 최적화 파ip라인에 필터를 통합하여, 개인정보 보장을 유지하면서도 모델의 유용성을 극대화한다.

실험 결과

연구 질문

RQ1개인화된 개인정보 회계는 적응형 데이터 분석에서 표준 조합 정리의 과도한 보수성 문제를 줄일 수 있는가?
RQ2적응형 조합 정리와 호환되면서도 개인별 개인정보 손실을 어떻게 추정하고 추적할 수 있는가?
RQ3하이퍼파라미터가 최적화되지 않은 경우, 개인화된 개인정보 회계가 개인 정보 보호 기반 학습에서 모델 유용성에 어떤 영향을 미치는가?
RQ4레니 기반 개인 정보 보호 필터는 기존의 (ε,δ)-개인정보 보호 필터보다 더 단순하고 날카운트한가?
RQ5하이퍼파라미터 조정이 실용적으로 불가능한 실제 환경에서 개인 필터링은 성능 향상에 얼마나 기여하는가?

주요 결과

제안된 레니 필터는 기존의 (ε,δ)-DP 필터보다 특히 적응형 설정에서 더 단순하고 날카운트한 개인정보 회계 메커니즘을 제공한다.
개인 정보 보호 기반 SGD에서 개인별 개인정보 회계는 측정 가능한 정확도 향상을 이끌어낸다. ε=0.3일 때, 클리핑이 최적화되지 않은 상황에서 정확도가 84.47%에서 92.25%로 향상되었다.
ε=0.5일 때, 클리핑이 최적화되지 않은 상황에서 정확도가 92.07%에서 94.30%로 향상되어 비최적 설정 환경에서 상당한 성능 향상을 보였다.
심지어 노이즈 수준이 최적화되지 않은 상황에서도, ε=0.3일 때 정확도가 86.88%에서 91.20%로 향상되어 하이퍼파라미터 오설정에 대해 뛰어난 내성적 특성을 보였다.
개인 필터링의 이점은 작은 ε 값에서 가장 두드러지며, 이는 최적화된 설정과 비최적 설정 간의 유용성 격차가 가장 큰 영역이기 때문이다.
이 방법은 구현이 간편하고 실용적이며, 기존 코드베이스에 최소한의 수정으로도 개인 정보 보호 학습 파이프라인에 성공적으로 통합된 것으로 나타났다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.