[论文解读] Privacy-Preserving Federated Learning with Verifiable Fairness Guarantees
CryptoFair-FL 引入一种加密框架,在保护隐私的同时提供可验证的公平性保证,实现接近最优的隐私-公平权衡和可扩展的分批验证。
Federated learning enables collaborative model training across distributed institutions without centralizing sensitive data; however, ensuring algorithmic fairness across heterogeneous data distributions while preserving privacy remains fundamentally unresolved. This paper introduces CryptoFair-FL, a novel cryptographic framework providing the first verifiable fairness guarantees for federated learning systems under formal security definitions. The proposed approach combines additively homomorphic encryption with secure multi-party computation to enable privacy-preserving verification of demographic parity and equalized odds metrics without revealing protected attribute distributions or individual predictions. A novel batched verification protocol reduces computational complexity from BigO(n^2) to BigO(n \log n) while maintaining (\dparam, \deltap)-differential privacy with dparam = 0.5 and deltap = 10^{-6}. Theoretical analysis establishes information-theoretic lower bounds on the privacy cost of fairness verification, demonstrating that the proposed protocol achieves near-optimal privacy-fairness tradeoffs. Comprehensive experiments across four benchmark datasets (MIMIC-IV healthcare records, Adult Income, CelebA, and a novel FedFair-100 benchmark) demonstrate that CryptoFair-FL reduces fairness violations from 0.231 to 0.031 demographic parity difference while incurring only 2.3 times computational overhead compared to standard federated averaging. The framework successfully defends against attribute inference attacks, maintaining adversarial success probability below 0.05 across all tested configurations. These results establish a practical pathway for deploying fairness-aware federated learning in regulated industries requiring both privacy protection and algorithmic accountability.
研究动机与目标
- 解决在没有集中访问敏感属性的情况下确保联邦学习算法公平性的挑战。
- 在正式安全定义下提供可验证的公平性保证。
- 在多机构设置中实现隐私保护、可扩展的对人口统计公平性和等机会性平衡的验证。
- 表征隐私-公平权衡并在多样化数据集上进行经验验证。
提出的方法
- 将加性同态加密与安全多方计算结合,以实现加密的公平性验证。
- 提出批量公平性验证协议,将计算量从 O(n^2) 降至 O(n log n)。
- 为公平性验证在诚实但好奇和恶意模型下提供差分隐私保证(epsilon, delta)。
- 使用阈值解密和零知识区间证明,防御恶意参与者。
- 将公平性验证扩展到具有层级聚合的交叉分组。
- 理论分析得到人口统计平等性验证的 epsilon 下界,并分析轮次之间的组合性。
实验结果
研究问题
- RQ1如何在不揭示受保护属性分布的情况下验证联邦学习中的公平性指标?
- RQ2哪些密码学技术能够在联邦环境中实现隐私保护、可验证的公平性?
- RQ3在迭代训练中,隐私预算与公平性验证精度之间的权衡是什么?
- RQ4该协议能否扩展到现实的联邦规模并保持模型效用?
- RQ5在重复验证下,对属性推断攻击的防御有多有效?
主要发现
| 方法 | Δ_DP | Δ_EO | AUROC | 准确率 |
|---|---|---|---|---|
| FedAvg | 0.231 b1 0.021 | 0.187 b1 0.018 | 0.872 b1 0.008 | 0.823 b1 0.007 |
| Local Fair | 0.142 b1 0.032 | 0.118 b1 0.027 | 0.854 b1 0.011 | 0.807 b1 0.009 |
| Centralized | 0.018 b1 0.004 | 0.021 b1 0.005 | 0.868 b1 0.007 | 0.819 b1 0.006 |
| CryptoFair-FL | 0.031 b1 0.008 | 0.034 b1 0.009 | 0.857 b1 0.009 | 0.811 b1 0.008 |
- CryptoFair-FL 在医疗死亡率任务中实现了人口统计平等性验证,将违背度从 0.231 降至 0.031。
- 批量验证将加密公平性计算从 O(n^2) 降至 O(n log n),相对于标准联邦学习的额外开销约为 2.3 倍。
- 在四组基准测试中,CryptoFair-FL 显示出近似最优的隐私-公平权衡,并保持与非隐私保护基线相当的 AUROC。
- 该框架能抵御属性推断攻击,在各配置下对手的成功概率保持在 0.05 以下。
- 具有 K 个二进制属性的交叉分组验证的时间复杂度为 O(K n log n),并具有有界的近似误差。
- 在 MIMIC-IV 数据集上,最终模型的 AUROC 为 0.857,DP 违背度为 0.031,达到典型医疗审计阈值。
- 经验结果印证了理论隐私保证,并显示可控的通信开销(约为 FedAvg 的 2.3 倍)。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。