Skip to main content
QUICK REVIEW

[논문 리뷰] FairGAN: Fairness-aware Generative Adversarial Networks

Depeng Xu, Shuhan Yuan|arXiv (Cornell University)|2018. 05. 28.
Ethics and Social Impacts of AI참고 문헌 22인용 수 40
한 줄 요약

FairGAN은 차별적 취급이나 차별적 영향 없이 합성 데이터를 생성하는 공정성 인식 GAN을 도입하며, 데이터 유용성을 보존하고 실제 데이터에 대한 공정한 분류를 가능하게 한다.

ABSTRACT

Fairness-aware learning is increasingly important in data mining. Discrimination prevention aims to prevent discrimination in the training data before it is used to conduct predictive analysis. In this paper, we focus on fair data generation that ensures the generated data is discrimination free. Inspired by generative adversarial networks (GAN), we present fairness-aware generative adversarial networks, called FairGAN, which are able to learn a generator producing fair data and also preserving good data utility. Compared with the naive fair data generation models, FairGAN further ensures the classifiers which are trained on generated data can achieve fair classification on real data. Experiments on a real dataset show the effectiveness of FairGAN.

연구 동기 및 목표

  • Predictive analytics에서 차별 예방을 위해 실제 데이터 세트를 수정하기보다 공정한 합성 데이터를 생성한다는 동기 부여.
  • GAN 기반 프레임워크를 개발하여 생성된 데이터에서 데이터 유용성과 공정성을 모두 달성한다.
  • 합성 데이터로 학습된 분류기가 실제 데이터에 대해 공정하고 정확한 예측을 달성하도록 한다.

제안 방법

  • 하나의 생성기와 두 개의 구별자를 사용하여 공정한 결합 분포 P_G(x,y,s)를 학습하는 동시에 P_G(x,y|s=1)=P_G(x,y|s=0)을 강제한다.
  • D1을 사용하여 (x,y,s) 공간에서 생성 데이터와 실제 데이터를 정렬 맞춤화한다.
  • D2를 사용하여 생성된 (x,y)와 보호 속성 s 사이의 독립성을 강제하여 차별적 영향 제거한다.
  • 생성기를 보호 속성 s로 조건화하여 s가 주어졌을 때 (x̂,ŷ)를 생성하고, 이산 및 연속 속성에 대해 자동인코더 기반 아키텍처(G-Dec)를 적용한다.
  • 공동의 최소-최대 목표를 최적화한다: min_G Dec max_D1,D2 V(G Dec, D1, D2) = V1 + λ V2, 여기서 V1은 데이터 현실성, V2는 조건 분포를 통한 공정성을 강제한다.
  • G-Dec의 사전 학습 및 Algorithm 1과 같은 적대적 업데이트를 포함하는 학습 알고리즘을 제공한다.

실험 결과

연구 질문

  • RQ1데이터 유용성을 보존하면서 차별화된 취급 및 차별적 영향을 제거하는 합성 데이터를 어떻게 생성할 수 있는가?
  • RQ2GAN 기반 프레임워크가 합성 데이터로 학습된 분류기가 실제 데이터에서 여전히 정확하고 공정하도록 하는가?
  • RQ3공정성 제약 λ의 도입이 생성 데이터의 유용성과 공정성 간 트레이드오프에 어떤 영향을 미치는가?

주요 결과

  • FairGAN은 생성된 특징과 보호 속성 간의 상관관계를 제거함으로써 데이터 공정성과 분류 공정성을 충족하는 데이터를 생성할 수 있다.
  • 이론적 분석은 최소-최대 최적화가 Jensen-Shannon 발산의 합으로 축소되어, 공정하고 현실적인 분포로의 수렴을 가이드한다.
  • 무작위 FairGAN 변형과 비교할 때, FairGAN은 실제 데이터에 가까운 조건 분포를 달성하면서 P_G(x|s=1)와 P_G(x|s=0)가 유사해 예측 편향을 줄인다.
  • 실험 데이터 세트에 대한 실험 결과는 데이터 유용성은 좋고, 합성 데이터로 학습된 분류기가 높은 정확도를 보이며 공정한 데이터 생성을 효과적으로 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.