Skip to main content
QUICK REVIEW

[論文レビュー] Squared Earth Mover's Distance-based Loss for Training Deep Neural Networks

Le Hou, Chen-Ping Yu|arXiv (Cornell University)|Nov 17, 2016
Machine Learning and Data Classification参考文献 33被引用数 95
ひとこと要約

本論文は、クラス間の順序や類似性といった相互関係を明示的にモデル化することで、単一ラベル分類における深層ニューラルネットワークの性能を向上させるために、正確な二乗地球移動距離(EMD²)に基づく新しいトレーニング損失を提案する。クラス関係に関する事前知識がなくても、畳み込みニューラルネットワーク(CNN)特徴量からグランド距離行列を自己教師的に学習する手法を導入し、年齢推定および画像アスレチックスデータセットで最先端の結果を達成している。また、クラス間構造が弱いデータセットに対しても安全に一般化可能である。

ABSTRACT

In the context of single-label classification, despite the huge success of deep learning, the commonly used cross-entropy loss function ignores the intricate inter-class relationships that often exist in real-life tasks such as age classification. In this work, we propose to leverage these relationships between classes by training deep nets with the exact squared Earth Mover's Distance (also known as Wasserstein distance) for single-label classification. The squared EMD loss uses the predicted probabilities of all classes and penalizes the miss-predictions according to a ground distance matrix that quantifies the dissimilarities between classes. We demonstrate that on datasets with strong inter-class relationships such as an ordering between classes, our exact squared EMD losses yield new state-of-the-art results. Furthermore, we propose a method to automatically learn this matrix using the CNN's own features during training. We show that our method can learn a ground distance matrix efficiently with no inter-class relationship priors and yield the same performance gain. Finally, we show that our method can be generalized to applications that lack strong inter-class relationships and still maintain state-of-the-art performance. Therefore, with limited computational overhead, one can always deploy the proposed loss function on any dataset over the conventional cross-entropy.

研究の動機と目的

  • 現実の分類タスクにおける順序や類似性といったクラス間関係を無視する交差エントロピー損失の限界を是正すること。
  • クラスの相違度を反映したグランド距離行列に従って誤分類をペナルティ化する、微分可能で正確なEMD²に基づく損失関数を構築すること。
  • トレーニング中にCNN特徴量からグランド距離行列をエンドツーエンドで学習可能とし、クラス関係に関する手作業または外部の事前知識を排除すること。
  • 本手法が、クラス間構造が弱いか、あるいは存在しないデータセットに対しても一般化できることを示すこと。性能が維持または向上することを確認すること。
  • 画像データのみを用い、補助属性を一切使用しない状況で、Adience、AADB、ImageNetといったベンチマークデータセットで最先端の性能を達成すること。

提案手法

  • クラスの相違度がグランド距離行列に符号化された状態で、予測確率分布を真のラベルone-hot分布に変換する最小コストを測るため、正確な二乗地球移動距離(EMD²)を損失関数として使用する。
  • クラスが順序付けられている場合に限り、EMD²の計算に閉形式解を用いることで、損失関数をバックプロパゲーションで効率的に処理可能とする。
  • CNN自身のクラス重心特徴量を用いて、バックプロパゲーション中にグランド距離行列を学習する自己指導的トレーニング戦略を提案する。
  • 推定された距離行列に基づくEMD²を用いた正則化項を導入し、追加のハイパーパrameterを必要とせず、繰り返し更新されるようにする。
  • グランド距離行列を、CNNの最終全結合層から抽出したクラス重心特徴量間のペアワイズL2距離として計算する。
  • 連続ラベルをビンに分割することで、回帰的アプローチのベースラインと比較可能な形で、分類および回帰的データセットの両方へ適用可能とする。

実験結果

リサーチクエスチョン

  • RQ1正確なEMD²に基づく損失関数は、クラス間関係をモデル化することで、単一ラベル分類における深層学習の性能を向上させることができるか?
  • RQ2クラス関係に関する事前知識がなくても、CNN特徴量からグランド距離行列をトレーニング中に効果的に学習できるか?
  • RQ3自己指導的EMD²正則化は、クラス間構造が弱いか、あるいは存在しないデータセット(例:ImageNet)に対しても一般化可能か?
  • RQ4順序付きまたは連続ラベルを有するデータセットにおいて、EMD²損失は交差エントロピー損失およびL2回帰損失と比較して性能に優れているか?
  • RQ5強いクラス間順序がないデータセットでは、学習された距離行列が誤った関係を捉えることはないか?

主な発見

  • Adience年齢推定データセットでは、8つのVGG-Fネットワークのアンサンブルを用いてスピアマンのρが0.6889を達成し、以前の最先端手法を上回った。
  • AADB画像アスレチックスデータセットでは、画像データのみを用いてスピアマンのρが0.6889を達成し、11個の追加属性ラベルを用いた以前の最先端モデルを上回った。
  • 自己指導的EMD²正則化法は、真の距離行列を用いたEMD²損失と同等の性能を達成しており、クラス関係のエンドツーエンド学習が有効であることを示した。
  • ImageNet ILSVRC 2012では、交差エントロピー損失と同等の性能を維持し、ペアワイズ距離の標準偏差(SDD)が0.00614であったことから、クラス間関係が弱いことが示され、性能の低下もなかった。
  • 年齢推定およびアスレチックスデータセットの両方で、交差エントロピー損失およびL2回帰ベースラインを著しく上回り、スピアマンのρで最大0.0682の向上を達成した。
  • 学習されたグランド距離行列は、順序付きデータセット(例:年齢、アスレチックス)では意味のあるクラス関係を効果的に捉えており、クラス間順序が弱いImageNetのようなデータセットでは誤った構造を捉えることなく、適切に一般化していた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。