Skip to main content
QUICK REVIEW

[论文解读] Fairness Through Awareness

Cynthia Dwork, Moritz Hardt|arXiv (Cornell University)|Apr 20, 2011
Privacy-Preserving Technologies in Data参考文献 14被引用 43
一句话总结

本文提出了一种分类任务中的公平性框架,通过任务特定的相似性度量确保相似个体受到相似对待,形式化为分类器上的Lipschitz条件。该框架将公平性建模为线性规划问题,以在保证个体公平性的同时优化效用,并表明该方法可在不损害公平性或导致间接歧视的前提下实现统计均等。

ABSTRACT

We study fairness in classification, where individuals are classified, e.g., admitted to a university, and the goal is to prevent discrimination against individuals based on their membership in some group, while maintaining utility for the classifier (the university). The main conceptual contribution of this paper is a framework for fair classification comprising (1) a (hypothetical) task-specific metric for determining the degree to which individuals are similar with respect to the classification task at hand; (2) an algorithm for maximizing utility subject to the fairness constraint, that similar individuals are treated similarly. We also present an adaptation of our approach to achieve the complementary goal of "fair affirmative action," which guarantees statistical parity (i.e., the demographics of the set of individuals receiving any classification are the same as the demographics of the underlying population), while treating similar individuals as similarly as possible. Finally, we discuss the relationship of fairness to privacy: when fairness implies privacy, and how tools developed in the context of differential privacy may be applied to fairness.

研究动机与目标

  • 解决在保持分类器效用的同时防止分类系统中歧视的问题。
  • 开发一种基于个体相似性而非群体统计的规范性公平性框架。
  • 将公平性建模为优化问题,以在基于相似性度量的Lipschitz约束下最大化效用。
  • 探讨公平性与隐私之间的关系,特别是公平性约束如何限制关于受保护属性的信息泄露。
  • 研究个体公平性如何隐含或与群体层面的公平性属性(如统计均等)共存。

提出的方法

  • 为给定分类任务定义一个任务特定的、公开的距离度量 $ d(x,y) $,以量化个体之间的相似性。
  • 将公平性形式化为Lipschitz条件:个体 $ x $ 和 $ y $ 的结果分布之间的统计距离不得超过 $ d(x,y) $。
  • 将分类器建模为从个体到结果分布的随机映射,确保个体特征的微小变化仅导致结果概率的微小变化。
  • 将公平分类器的设计建模为一个线性规划问题,以最小化期望效用损失,同时满足Lipschitz公平性约束。
  • 利用线性规划的对偶性来解释和分析公平性约束及其与效用的权衡。
  • 通过将个体公平性与统计均等约束相结合,将该框架扩展以实现“公平正向行动”。

实验结果

研究问题

  • RQ1如何以一种确保相似个体受到相似对待的方式形式化分类中的公平性,而无需依赖群体层面的统计?
  • RQ2通过相似性度量定义的个体公平性能否在保持分类器效用的前提下高效优化?
  • RQ3通过Lipschitz约束定义的个体公平性与群体公平性(如统计均等)之间存在何种关系?
  • RQ4分类中的公平性约束是否也能作为一种隐私保护形式,特别是防止对受保护属性的推断?
  • RQ5在何种条件下,个体公平性可隐含或防止关于敏感属性的信息泄露?

主要发现

  • 该框架通过分类器上的Lipschitz条件形式化公平性,确保根据任务特定度量定义的相似个体获得相似的结果分布。
  • 构建公平分类器的优化问题可作为线性规划高效求解,支持实际部署。
  • 在特定条件下,通过Lipschitz条件实现的个体公平性可隐含统计均等,但仅靠统计均等不足以确保个体层面的公平性。
  • 该框架可通过将个体公平性与人口均等约束相结合,实现“公平正向行动”。
  • 尽管统计均等可隐藏关于受保护群体的信息,但对间接推断不具鲁棒性——广告商仍可针对如“艾滋病”等子群体进行定向投放,即使“HIV阳性”被保护。
  • 若选择合适的度量,Lipschitz条件可能比统计均等提供更强的隐私保障,尽管这仍需进一步研究。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。