[论文解读] Ensuring Fairness Beyond the Training Data
本文提出了一种用于训练公平且鲁棒分类器的极小-极大框架,该分类器在训练数据的分布扰动下仍能保持公平性。通过构建一个分布鲁棒优化问题并利用在线学习,该方法可保证收敛至一个在各种测试时分布偏移下均保持公平性和高准确率的分类器。
We initiate the study of fair classifiers that are robust to perturbations in the training distribution. Despite recent progress, the literature on fairness has largely ignored the design of fair and robust classifiers. In this work, we develop classifiers that are fair not only with respect to the training distribution, but also for a class of distributions that are weighted perturbations of the training samples. We formulate a min-max objective function whose goal is to minimize a distributionally robust training loss, and at the same time, find a classifier that is fair with respect to a class of distributions. We first reduce this problem to finding a fair classifier that is robust with respect to the class of distributions. Based on online learning algorithm, we develop an iterative algorithm that provably converges to such a fair and robust solution. Experiments on standard machine learning fairness datasets suggest that, compared to the state-of-the-art fair classifiers, our classifier retains fairness guarantees and test accuracy for a large class of perturbations on the test set. Furthermore, our experiments show that there is an inherent trade-off between fairness robustness and accuracy of such classifiers.
研究动机与目标
- 通过设计在训练数据之外的分布扰动下仍保持公平的分类器,弥补公平性研究中的空白。
- 构建一个极小-极大目标,联合最小化分布鲁棒训练损失,并确保在一类扰动分布下的公平性。
- 基于在线学习开发一种迭代算法,可保证收敛至公平且鲁棒的分类器。
- 评估在分布偏移下公平性鲁棒性与模型准确率之间的权衡。
提出的方法
- 构建一个极小-极大优化问题,以最小化对训练分布加权扰动类的最坏情况风险。
- 将问题简化为寻找对指定扰动分布类具有鲁棒性的公平分类器。
- 采用基于在线学习的算法,迭代更新分类器和对偶变量,确保收敛至最优解。
- 将公平分类器作为内层目标,约束其在所考虑类别的所有扰动分布下均保持公平。
- 利用在线学习理论中的收敛性保证,确保算法可达到公平且鲁棒的解。
- 通过在优化中整合公平度量作为约束,将公平性约束融入极小-极大框架。
实验结果
研究问题
- RQ1能否训练一个分类器,使其在对训练数据进行加权扰动的分布偏移下仍保持公平?
- RQ2如何在一个统一的训练框架中联合优化公平性与鲁棒性?
- RQ3在存在分布偏移的情况下,公平性鲁棒性与预测准确率之间的权衡是什么?
- RQ4基于在线学习的迭代算法能否可证明地收敛至公平且鲁棒的分类器?
主要发现
- 所提出的方法在广泛的测试时分布扰动下维持了公平性保证,其鲁棒性优于当前最先进的公平分类器。
- 该分类器在显著的分布偏移下仍保持高测试准确率并维持公平性。
- 实验表明,公平性鲁棒性与模型准确率之间存在清晰的权衡,鲁棒性提升导致准确率小幅下降。
- 基于在线学习的算法可收敛至公平且鲁棒的解,理论收敛性保证已得到验证。
- 该方法有效将公平性泛化至训练分布之外,确保在加权扰动下的公平性。
- 实证结果表明,标准公平分类器在分布偏移下无法维持公平性,而所提方法仍保持鲁棒性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。