QUICK REVIEW

[论文解读] FairGAN: Fairness-aware Generative Adversarial Networks

Depeng Xu, Shuhan Yuan|arXiv (Cornell University)|May 28, 2018

Ethics and Social Impacts of AI参考文献 22被引用 40

一句话总结

FairGAN 引入一个公平性感知的 GAN，可以生成没有差别对待或差别化影响的合成数据，同时保留数据的实用性，并在真实数据上实现公平的分类。

ABSTRACT

Fairness-aware learning is increasingly important in data mining. Discrimination prevention aims to prevent discrimination in the training data before it is used to conduct predictive analysis. In this paper, we focus on fair data generation that ensures the generated data is discrimination free. Inspired by generative adversarial networks (GAN), we present fairness-aware generative adversarial networks, called FairGAN, which are able to learn a generator producing fair data and also preserving good data utility. Compared with the naive fair data generation models, FairGAN further ensures the classifiers which are trained on generated data can achieve fair classification on real data. Experiments on a real dataset show the effectiveness of FairGAN.

研究动机与目标

通过生成公平的合成数据来推动预测分析中的歧视防范，而不是修改真实数据集。
开发一个基于 GAN 的框架，使生成的数据同时具备数据实用性和公平性。
确保在合成数据上训练的分类器在真实数据上实现公平且准确的预测。

提出的方法

构建 FairGAN，使用一个生成器和两个判别器来学习公平的联合分布 P_G(x,y,s)，同时强制 P_G(x,y|s=1)=P_G(x,y|s=0)。
使用 D1 将生成的数据在 (x,y,s) 空间与真实数据对齐。
使用 D2 强制生成的 (x,y) 与受保护属性 s 之间的独立性，消除差别化影响。
对生成器进行受保护属性 s 的条件化，以在给定 s 的情况下产生 (x̂,ŷ)，并对离散和连续属性应用自编码器为基础的架构（G-Dec）。
优化一个联合的 min-max 目标： min_G Dec max_D1,D2 V(G Dec, D1, D2) = V1 + λ V2，其中 V1 强制数据真实性，V2 通过条件分布实现公平性。
提供训练算法，包括自编码器的预训练和如 Algorithm 1 所示的对抗更新。

实验结果

研究问题

RQ1我们如何生成在保持实用性的同时去除歧视（差别对待和差别化影响）的合成数据？
RQ2基于 GAN 的框架能否生成公平数据，使在合成数据上训练的分类器在真实数据上仍然准确且公平？
RQ3在生成的数据中，公平性约束（λ）对实用性与公平性之间权衡有何影响？

主要发现

FairGAN 可以生成满足数据公平性和分类公平性的数据，通过消除生成特征与受保护属性之间的相关性来实现。
理论分析表明最小-最大目标收敛至一组 Jensen-Shannon 距离的和，指引收敛到公平且真实的分布。
与天真版本的 FairGAN 相比，FairGAN 实现了接近真实数据的条件分布，同时使 P_G(x|s=1) 与 P_G(x|s=0) 相似，降低了预测偏差。
在真实数据集上的实验结果表明，能够有效生成公平数据，具备良好的数据实用性，以及对用合成数据训练的分类器具有高正确率。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。