QUICK REVIEW

[论文解读] Fairness Through Computationally-Bounded Awareness

Michael P. Kim, Omer Reingold|arXiv (Cornell University)|Mar 8, 2018

Ethics and Social Impacts of AI参考文献 9被引用 52

一句话总结

这篇论文引入 metric multifairness，一种通过度量样本界限可学习的对公平性的放宽版，允许对相似子人群进行公平对待，而不需要对相似性度量的完全了解。

ABSTRACT

We study the problem of fair classification within the versatile framework of Dwork et al. [ITCS '12], which assumes the existence of a metric that measures similarity between pairs of individuals. Unlike earlier work, we do not assume that the entire metric is known to the learning algorithm; instead, the learner can query this arbitrary metric a bounded number of times. We propose a new notion of fairness called metric multifairness and show how to achieve this notion in our setting. Metric multifairness is parameterized by a similarity metric $d$ on pairs of individuals to classify and a rich collection ${\cal C}$ of (possibly overlapping) "comparison sets" over pairs of individuals. At a high level, metric multifairness guarantees that similar subpopulations are treated similarly, as long as these subpopulations are identified within the class ${\cal C}$.

研究动机与目标

激励并形式化一种公平性概念，该概念不需要对所有个体对的完整度量知识。
引入 metric multifairness，作为基于丰富比较集合的 Lipschitz 风格公平性的放宽。
构建一个高效学习算法，能从少量度量样本中实现 metric multifairness。
演示如何通过后处理在不重新训练的情况下，对当前预测强制实现 metric multifairness。
分析公平性强度、样本复杂度和计算边界之间的权衡。

提出的方法

将 metric multifairness 相对于度量 d 与比较集合 C 定义，对集合 C 中的每个 S 强制平均 Lipschitz 条件。
提出一种切换子梯度下降算法，在优化线性假设类的损失的同时强制 multifairness。
表明 metric multifairness 可以从一个与 log|C| 成比例、与度量复杂度无关的度量样本数量实现。
提供一种后处理方法，利用少量度量样本将现有预测投影到 metric multifair 集合上。
将约束搜索问题约简为对集合 C 的无偏学习，以在 C 存在高效的无偏学习者时实现效率。
讨论表明样本复杂度的紧依性及与伪随机性的联系的困难性结果。

实验结果

研究问题

RQ1我们能否在不完全访问所有个体对的成对度量情况下实现有意义的公平性概念？
RQ2如何仅使用有限数量的度量样本来实现 Lipschitz 型公平性约束？
RQ3比较类 C 的表达能力与公平保证的强度之间的关系是什么？
RQ4我们能否在受限的度量访问下高效地学习或后处理预测以满足 metric multifairness？
RQ5metric multifairness 保证的固有局限性（样本复杂度、困难性）是什么？

主要发现

metric multifairness 通过对丰富但有界的比较集合 C 强制 Lipschitz 风格约束，推广了 metric fairness。
切换子梯度下降算法在高概率下学习 metric multifair 假设，使用 O(B^2 n^2 log(n/δ)/τ^2) 次迭代和 O(log(|C|/δ)/(γ τ^2)) 度量样本。
度量样本复杂度与 |C| 成对数相关，允许对指数级的比较类实现有效的公平保证。
如果 C 是 γ-大型且存在小平均距离的比较，metric multifair 假设在大量对中必须呈现更强的个体公平性（命题1）。
将问题归约到对 C 的无偏学习，提升对违反约束搜索的速度，当 C 存在高效的无偏学习器时可实现高效实现（定理3）。
困难性结果显示样本复杂度界上界在对数对数(|C|)因子下是紧的，并且对于 C 的某些可学习性假设对于高效有用结果是必要的（定理4、命题5）。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。