Skip to main content
QUICK REVIEW

[論文レビュー] A Simple Fix to Mahalanobis Distance for Improving Near-OOD Detection

Jie Ren, Stanislav Fort|arXiv (Cornell University)|Jun 16, 2021
Adversarial Robustness in Machine Learning参考文献 21被引用数 71
ひとこと要約

本論は Mahalanobis 距離の near-OOD 検出における失敗を分析し、Relative Mahalanobis Distance (RMD) を導入する。これは背景を補正した簡便な修正で、追加の学習なしに diverse benchmarks で near-OOD AUROC を改善する。

ABSTRACT

Mahalanobis distance (MD) is a simple and popular post-processing method for detecting out-of-distribution (OOD) inputs in neural networks. We analyze its failure modes for near-OOD detection and propose a simple fix called relative Mahalanobis distance (RMD) which improves performance and is more robust to hyperparameter choice. On a wide selection of challenging vision, language, and biology OOD benchmarks (CIFAR-100 vs CIFAR-10, CLINC OOD intent detection, Genomics OOD), we show that RMD meaningfully improves upon MD performance (by up to 15% AUROC on genomics OOD).

研究の動機と目的

  • 再学習やOODデータの要件なしで、堅牢な近傍OOD検出を動機づける。
  • 近傍OOD設定における標準的な Mahalanobis 距離(MD)の失敗モードを特定する。
  • INDと近傍OODデータ間の識別性を改善する、単純でハイパーパラメータ不要の修正(RMD)を提案する。
  • 視覚・言語・ゲノミクスのベンチマークにおけるRMDの頑健性と性能を示す。

提案手法

  • 中間ネットワーク特徴に対するクラス条件付きガウス適合を用いたOOD検出のためのMDをレビューする。
  • すべての訓練特徴上で背景(クラス非依存)ガウス適合を定義する。
  • 各クラス k に対して MD_k(z') = (z' - mu_k)^T Sigma^{-1} (z' - mu_k) を計算する。
  • 背景モデル N(mu_0, Sigma_0) から MD_0(z') を計算する。
  • Relative Mahalanobis Distance を定義する: RMD_k(z') = MD_k(z') - MD_0(z').
  • C_RMD(x') = -min_k { RMD_k(z') } をOOD検出の信頼度スコアとして用いる;同等には尤度比の見方で max_k log p_k(z') - log p_0(z').
  • RMD が非識別的な背景特徴からの寄与を削減し、識別的な上位次元を強調することを示す。

実験結果

リサーチクエスチョン

  • RQ1MDベースのOOD検出は、高次元の非識別的特徴のため近傍-OODの場合に信頼性を欠くことがあるか?
  • RQ2背景補正スコア(RMD)は、追加の訓練やOODデータなしで、識別的データと近傲OODデータの分離を改善するか?
  • RQ3RMD はハイパーパラメータの選択に頑健で、複数のモダリティと事前学習設定で効果的か?
  • RQ4視覚、言語、ゲノミクスの近傍OODベンチマークにおいて、MDとMSPと比較してRMDはどうか?

主な発見

  • RMD は複数のベンチマークで、再訓練やOODデータ不要のまま MD よりも近傍OODの AUROC を一貫して改善する。
  • CIFAR-100 対 CIFAR-10 では、MD AUROC 74.91% に対し RMD 81.01%(MSP 80.14%)。
  • CIFAR-10 対 CIFAR-100 では、MD AUROC 88.49% に対し RMD 89.71%(MSP 89.27%)。
  • ゲノミクス分野のOODは、事前学習モデルを用いた場合に RMD が MD より大きな利得を示す(例; MD 48.46% 対 RMD 60.36%、BERT事前学習)。CLINC OOD: MD 75.48% 対 RMD 91.98%(BERT事前学習)。
  • 事前学習したバックボーンをファインチューニングせずに用いた場合、RMD は ViT、BiT、CLIP、BERT ベースの設定で MD を上回る。例えば BiT を用いた CIFAR-100 対 CIFAR-10 では MD 81.37% 対 RMD 84.60%。
  • ファインチューニング後は MD の性能が向上することが多く、RMD とのギャップが縮まる場合もある(例: CIFARタスクの ViT-B16 では MD 93.09% 対 RMD 93.09% のときは MD が 94.42%、CIFAR-10 対 CIFAR-100 では MD 99.87% 対 RMD 98.82%)。
  • RMD は MD より訓練中の安定性が高く、ゲノミクスのBERTファインチューニングなどで MD が低下する場面でも堅牢性を保つ。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。