Skip to main content
QUICK REVIEW

[論文レビュー] Confidence-Aware Learning for Deep Neural Networks

Jooyoung Moon, Jihyo Kim|arXiv (Cornell University)|Jul 3, 2020
Anomaly Detection Techniques and Applications被引用数 47
ひとこと要約

tldr: 本研究は Correctness Ranking Loss(CRL)を導入し、標準的な深層分類器を訓練して信頼度推定を適切に順位付けかつ信頼できるものにする。追加のアーキテクチャ変更や重い計算を要せず、キャリブレーション、OOD検出、アクティブ学習を改善する。

ABSTRACT

Despite the power of deep neural networks for a wide range of tasks, an overconfident prediction issue has limited their practical use in many safety-critical applications. Many recent works have been proposed to mitigate this issue, but most of them require either additional computational costs in training and/or inference phases or customized architectures to output confidence estimates separately. In this paper, we propose a method of training deep neural networks with a novel loss function, named Correctness Ranking Loss, which regularizes class probabilities explicitly to be better confidence estimates in terms of ordinal ranking according to confidence. The proposed method is easy to implement and can be applied to the existing architectures without any modification. Also, it has almost the same computational costs for training as conventional deep classifiers and outputs reliable predictions by a single inference. Extensive experimental results on classification benchmark datasets indicate that the proposed method helps networks to produce well-ranked confidence estimates. We also demonstrate that it is effective for the tasks closely related to confidence estimation, out-of-distribution detection and active learning.

研究の動機と目的

  • 特に安全 critical な応用分野において、深層ニューラルネットワークにおける信頼できる信頼度推定の必要性を喚起する。
  • アーキテクチャの変更を伴うことなく、信頼度推定の序数的ランキングを直接強制する訓練目的を提案する。
  • Correctness Ranking Loss (CRL) を開発し、標準のクロスエントロピー訓練とどのように統合されるかを示す。
  • CRL の画像分類ベンチマーク全体での有効性と、アウト・オブ・ディストリビューション検出やアクティブ学習といった関連タスクへの影響を示す。

提案手法

  • 正解の確率が高いサンプルほど高い信頼度を持つべきであるという序数的ランキング目標を定義する。
  • Correctness Ranking Loss (CRL) を導入する:L_CR = max(0, -g(c_i,c_j)(κ_i-κ_j) + |c_i-c_j|) をサンプル対 (paired samples) に適用し、ここで c_i はサンプル i の正解予測の割合、κ_i は信頼度指標。
  • ミニバッチ内で単純かつスケーラブルなサンプリング手法を用いて CRL を近似し、連続するサンプルをペアにし、バッチを巻き戻す。
  • CRL を標準のクロスエントロピーと組み合わせる:L = L_CE + λ L_CR、λ が CRL の影響を制御する。
  • κ の信頼度関数として、最大クラス確率、正規化された負エントロピー、マージなどを検討する。
  • 既存のアーキテクチャの構造を変更することなく CRL を適用できる実装の詳細を提供する。

実験結果

リサーチクエスチョン

  • RQ1単純な正則化損失(CRL)によって、アーキテクチャを変更せずに標準的な深層分類器においてよく順位付けされた信頼度推定を誘導できるか?
  • RQ2CRL は一般的な画像分類データセットにおける信頼度キャリブレーションと序数ランキング指標にどのように影響するか?
  • RQ3分類精度を超えて、アウト・オブ・ディストリビューション検出やアクティブ学習などの下流タスクに対して CRL は有益か?
  • RQ4従来の訓練と比較した場合の CRL の計算コストはどの程度か?

主な発見

  • CRL は複数のアーキテクチャとデータセットに渡ってよく順位付けされた信頼度推定を生み出す。
  • CRL を用いた訓練は、ベースラインおよび他の不確実性推定手法と比較して、信頼度関連指標(キャリブレーションとランキング)で競争力のあるまたは改善された性能を提供する。
  • CRL は信頼度ランク付けに関連するタスク、例えばアウト・オブ・ディストリビューション検出やアクティブ学習において、標準の分類器を一回の推論パスで用いて性能を改善する。
  • CRL はアーキテクチャの変更を必要とせず、訓練と推論の追加計算コストもほとんどかからない。
  • CRL ベースのモデルは Baseline より改善を達成し、さまざまな設定で MC ドロップアウト、アレアトリック+MC、AES などの手法と競合する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。