[论文解读] Fairness Without Demographics in Repeated Loss Minimization
该论文表明,当组身份未知时,经验风险最小化可能随时间放大表示差异,并引入分布鲁棒优化以界定潜在组的最坏情况风险,在模拟和真实任务中改善少数群体结果。
Machine learning models (e.g., speech recognizers) are usually trained to minimize average loss, which results in representation disparity---minority groups (e.g., non-native speakers) contribute less to the training objective and thus tend to suffer higher loss. Worse, as model accuracy affects user retention, a minority group can shrink over time. In this paper, we first show that the status quo of empirical risk minimization (ERM) amplifies representation disparity over time, which can even make initially fair models unfair. To mitigate this, we develop an approach based on distributionally robust optimization (DRO), which minimizes the worst case risk over all distributions close to the empirical distribution. We prove that this approach controls the risk of the minority group at each time step, in the spirit of Rawlsian distributive justice, while remaining oblivious to the identity of the groups. We demonstrate that DRO prevents disparity amplification on examples where ERM fails, and show improvements in minority group user satisfaction in a real-world text autocomplete task.
研究动机与目标
- 在未知分组标签的序列学习中,阐明表示差异及其放大的原因与影响。
- 提出基于 DRO 的方法,以界定潜在分组的最坏情况风险并在时间上稳定少数群体的结果。
- 提供将 DRO 与逐组风险控制和留存动态关联的理论保证。
- 展示 DRO 在模拟任务和真实世界自动补全实验中的经验收益。
提出的方法
- 将数据建模为来自具有未知身份的 K 个潜在分组,并旨在随时间最小化最坏组风险。
- 在经验分布周围采用卡方发散球,并将分布鲁棒风险 R_dro(θ; r) 定义为对高损失样本的赋权增强。
- 证明对每个分组有 R_k(θ) ≤ R_dro(θ; r_k),其中 r_k = (1/α_k − 1)^2,并使用 r_max = (1/α_min − 1)^2 来界定总体最坏情况风险。
- 提供一个对偶形式,使得可通过包含 η 参数和 (ℓ(θ; Z) − η)_+ 项的代理函数 F(θ; η) 来优化 DRO 目标。
- 概述一个优化例程,在 θ 更新(通过对偶目标的随机梯度下降)与 η 选择(如二分搜索)之间交替,产生一个实用的 DRO 求解器。
- 讨论稳定性含义,展示与 ERM 相比,DRO 如何产生更鲁棒、利少数群体的固定点。
实验结果
研究问题
- RQ1在缺乏人口统计身份信息时,ERM 是否会随时间放大差异?
- RQ2DRO 是否能提供关于最坏组风险的理论和经验界限,从而在序列更新中稳定少数群体结果?
- RQ3在模拟与真实任务(如自动补全)中,DRO 是否比 ERM 提高少数群体的满意度和留存率?
- RQ4在使用 DRO 时,确保最小少数群体比例 α_min 能随时间控制 R_max 的条件是什么?
主要发现
- 由于差异放大和固定点不稳定,ERM 随时间可能不公平。
- DRO 对最坏组风险进行界定,并且在 minority 比例有下界的情况下,随时间控制最坏风险。
- 在仿真中,DRO 能防止少数群体准确率崩溃并维持各组的平衡表现。
- 在 Mechanical Turk 的自动补全研究中,DRO 将少数群体满意度从 3.7 提高到 4.0,少数群体留存率从 0.7 提升到 0.85。
- DRO 通过提升满意度和留存率增加少数群体用户数量,说明其实际收益。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。