Skip to main content
QUICK REVIEW

[論文レビュー] Learning from Failure: Training Debiased Classifier from Biased Classifier

Jun Hyun Nam, Hyuntak Cha|arXiv (Cornell University)|Jul 6, 2020
Adversarial Robustness in Machine Learning参考文献 28被引用数 53
ひとこと要約

LfFは偏りを持つネットワークと偏りを取り除くネットワークを並行して訓練する。偏りを持つネットワークは初期にバイアスを増幅し、偏りを取り除くネットワークはバイアスが失敗するサンプルに焦点を当て、明示的なバイアスラベルなしで公正な精度を改善する。

ABSTRACT

Neural networks often learn to make predictions that overly rely on spurious correlation existing in the dataset, which causes the model to be biased. While previous work tackles this issue by using explicit labeling on the spuriously correlated attributes or presuming a particular bias type, we instead utilize a cheaper, yet generic form of human knowledge, which can be widely applicable to various types of bias. We first observe that neural networks learn to rely on the spurious correlation only when it is "easier" to learn than the desired knowledge, and such reliance is most prominent during the early phase of training. Based on the observations, we propose a failure-based debiasing scheme by training a pair of neural networks simultaneously. Our main idea is twofold; (a) we intentionally train the first network to be biased by repeatedly amplifying its "prejudice", and (b) we debias the training of the second network by focusing on samples that go against the prejudice of the biased network in (a). Extensive experiments demonstrate that our method significantly improves the training of the network against various types of biases in both synthetic and real-world datasets. Surprisingly, our framework even occasionally outperforms the debiasing methods requiring explicit supervision of the spuriously correlated attributes.

研究の動機と目的

  • 明示的なバイアスラベルが高価または利用不能な場合に、デバイアリングの動機づけ。
  • バイアスがターゲット属性より学習しやすい時に学習されることを示す訓練ダイナミクスを調査。
  • 偏りに焦点を当てた増幅と失敗駆動再重み付けを用いる2ネットワークのデバイアリング方式を開発。
  • 人工的および実世界のバイアスデータセット上でLfFを評価し、公正性の向上した性能を示す。

提案手法

  • 2つのネットワークを同時に訓練する:偏りを持つモデル fB と偏りを取り除くモデル fD。
  • 一般化クロスエントロピー (GCE) ロスを用いて fB のバイアスを増幅し、容易なサンプルを強調する。
  • 相対難易度ウェイト W(x) = CE(fB(x),y) / (CE(fB(x),y) + CE(fD(x),y)) を計算し、fD の CE ロスを再加重する。
  • 偏りと対立するサンプルを強調するように、W(x) を用いた重み付き CE ロスで fD を更新。
  • 悪性バイアスにおいて、標的属性より先にバイアスが学習されるという観測に基づいて重み付けを導く。
  • 明示的なバイアス監督に依存するベースラインと比較することも可能。)

実験結果

リサーチクエスチョン

  • RQ1明示的なバイアスラベルなしで訓練ダイナミクスを利用してデバイアリングを達成できるか(バイアスが先に学習されるという点を利用)?
  • RQ2偏りあり・なしの2つのネットワークが、バイアスデータセットで公正な精度を改善するか?
  • RQ3提案された GCE ベースのバイアス増幅が、バイアス対立サンプルの重み付きロスを介したデバイアリングとどのように相互作用するか?
  • RQ4人工データと CelebA や BAR のような実世界のデータセットで手法は頑健か?

主な発見

  • LfF は色バイアス、質感バイアス、ジェンダーBias を含むデータセット全体で公正でない精度を有意に向上させる。
  • Colored MNIST の高いバイアス整合比で、公正でない精度が 35.34% から 63.39% に改善。
  • Corrupted CIFAR-10 1 で 99.5% のバイアス整合サンプルにおいて、公正でない精度が 17.93% から 31.66% に改善(LfF)。
  • CelebA では、LfF は公正でない精度を高く、バイアス対立性能も Group DRO(明示的なバイアスラベルを使用)と比較して競合的。
  • BAR の現実世界データでは、LfF は多くのアクションクラスで vanilla および ReBias より優れており、現実的なバイアスシナリオでの有効性を示唆。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。