[논문 리뷰] Privacy-Preserving Federated Learning with Verifiable Fairness Guarantees
CryptoFair-FL은 프라이버시를 보존하면서 연합학습에서 검증 가능한 공정성 보장을 제공하는 암호 프레임워크를 도입하여 거의 최적에 가까운 프라이버시-공정성 트레이드오프와 확장 가능한 배치 검증을 달성합니다.
Federated learning enables collaborative model training across distributed institutions without centralizing sensitive data; however, ensuring algorithmic fairness across heterogeneous data distributions while preserving privacy remains fundamentally unresolved. This paper introduces CryptoFair-FL, a novel cryptographic framework providing the first verifiable fairness guarantees for federated learning systems under formal security definitions. The proposed approach combines additively homomorphic encryption with secure multi-party computation to enable privacy-preserving verification of demographic parity and equalized odds metrics without revealing protected attribute distributions or individual predictions. A novel batched verification protocol reduces computational complexity from BigO(n^2) to BigO(n \log n) while maintaining (\dparam, \deltap)-differential privacy with dparam = 0.5 and deltap = 10^{-6}. Theoretical analysis establishes information-theoretic lower bounds on the privacy cost of fairness verification, demonstrating that the proposed protocol achieves near-optimal privacy-fairness tradeoffs. Comprehensive experiments across four benchmark datasets (MIMIC-IV healthcare records, Adult Income, CelebA, and a novel FedFair-100 benchmark) demonstrate that CryptoFair-FL reduces fairness violations from 0.231 to 0.031 demographic parity difference while incurring only 2.3 times computational overhead compared to standard federated averaging. The framework successfully defends against attribute inference attacks, maintaining adversarial success probability below 0.05 across all tested configurations. These results establish a practical pathway for deploying fairness-aware federated learning in regulated industries requiring both privacy protection and algorithmic accountability.
연구 동기 및 목표
- 민감 속성에 대한 중앙 집중식 접근 없이 연합학습에서 알고리즘적 공정성을 보장하는 문제를 다룬다.
- 형식적 보안 정의 하에 검증 가능한 공정성 보장을 제공한다.
- 다기관 환경에서 개인정보 보호를 유지하면서 인구통계적 평등성(demographic parity)과 균등화된 가능성(equalized odds)을 효율적으로 검증하는 방법을 가능하게 한다.
- 프라이버시-공정성 트레이드오프를 특징짓고 다양한 데이터셋에서 경험적으로 검증한다.
제안 방법
- 덧셈 동형 암호화(additively homomorphic encryption)와 안전 다당 참여 계산(secure multi-party computation)을 결합하여 암호화된 공정성 검증을 가능하게 한다.
- 연속 배치된 공정성 검증 프로토콜을 도입하여 계산을 O(n^2)에서 O(n log n)로 감소시킨다.
- 정직하지만 호기심 많은 모델 및 악의적 모델 하에서 공정성 검증에 대한 차등 프라이버시 보장(epsilon, delta)을 제공한다.
- 악의적 참여자에 대항하기 위해 임계 복호화와 제로지식 구간 증명을 사용한다.
- 계층적 집계 체계를 갖춘 교차 특성(intersectional) 그룹에 대한 공정성 검증을 확장한다.
- 이론적 분석은 인구통계적 평등성 검증에 대한 epsilon의 하한을 도출하고 라운드 간 구성을 분석한다.
실험 결과
연구 질문
- RQ1보호 속성 분포를 노출하지 않고 연합학습에서 공정성 지표를 어떻게 검증할 수 있는가?
- RQ2원격 설정에서 프라이버시 보존 및 검증 가능한 공정성을 보장하는 어떤 암호 기술이 있는가?
- RQ3반복 학습에서 프라이버시 예산과 공정성 검증 정확도 사이의 트레이드오프는 무엇인가?
- RQ4이 프로토콜이 현실적인 연합 규모로 확장되고 모델 유용성을 유지할 수 있는가?
- RQ5반복 검증 하에서 속성 추론 공격에 대한 방어가 얼마나 효과적인가?
주요 결과
| 방법 | Δ_DP | Δ_EO | AUROC | 정확도 |
|---|---|---|---|---|
| FedAvg | 0.231 \u0000b1 0.021 | 0.187 \u0000b1 0.018 | 0.872 \u0000b1 0.008 | 0.823 \u0000b1 0.007 |
| Local Fair | 0.142 \u0000b1 0.032 | 0.118 \u0000b1 0.027 | 0.854 \u0000b1 0.011 | 0.807 \u0000b1 0.009 |
| Centralized | 0.018 \u0000b1 0.004 | 0.021 \u0000b1 0.005 | 0.868 \u0000b1 0.007 | 0.819 \u0000b1 0.006 |
| CryptoFair-FL | 0.031 \u0000b1 0.008 | 0.034 \u0000b1 0.009 | 0.857 \u0000b1 0.009 | 0.811 \u0000b1 0.008 |
- CryptoFair-FL은 의료 사망률 작업에서 불일치(violation)를 0.231에서 0.031로 감소시켜 인구통계적 평등성 검증을 달성한다.
- 배치 검증은 암호화된 공정성 계산을 O(n^2)에서 O(n log n)으로 감소시키고 표준 연합학습 대비 약 2.3배의 오버헤드를 수반한다.
- 네 가지 벤치마크에 걸쳐 CryptoFair-FL은 거의 최적의 프라이버시-공정성 트레이드오프를 보이고 비프라이버시 보존 기준선과 비교해 AUROC를 유지한다.
- 프레임워크는 속성 추론 공격에 대한 방어를 제공하며 구성을 불문하고 악의적 성공 확률을 0.05 미만으로 유지한다.
- K개의 이진 속성으로 이루어진 교차 검증은 근사 오차가 한정된 상태에서 O(K n log n)로 확장된다.
- MIMIC-IV에서 최종 모델은 AUROC 0.857에 DP 위반 0.031로 일반적인 의료 감사 임계치를 충족한다.
- 실증 결과는 이론적 프라이버시 보장을 뒷받침하고 FedAvg 대비 약 2.3배의 통신 오버헤드를 보여준다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.