QUICK REVIEW

[論文レビュー] Out-of-distribution Detection with Implicit Outlier Transformation

Qizhou Wang, Junjie Ye|arXiv (Cornell University)|Mar 9, 2023

Anomaly Detection Techniques and Applications被引用数 10

ひとこと要約

この論文は Distributional-agnostic Outlier Exposure (DOE) を紹介する。これは model perturbations を通じた暗黙のデータ変換によって最悪ケースのOODデータを合成し、 unseen distributions での一様なOOD検出性能を達成するミニマックス学習フレームワークである。

ABSTRACT

Outlier exposure (OE) is powerful in out-of-distribution (OOD) detection, enhancing detection capability via model fine-tuning with surrogate OOD data. However, surrogate data typically deviate from test OOD data. Thus, the performance of OE, when facing unseen OOD data, can be weakened. To address this issue, we propose a novel OE-based approach that makes the model perform well for unseen OOD situations, even for unseen OOD cases. It leads to a min-max learning scheme -- searching to synthesize OOD data that leads to worst judgments and learning from such OOD data for uniform performance in OOD detection. In our realization, these worst OOD data are synthesized by transforming original surrogate ones. Specifically, the associated transform functions are learned implicitly based on our novel insight that model perturbation leads to data transformation. Our methodology offers an efficient way of synthesizing OOD data, which can further benefit the detection model, besides the surrogate OOD data. We conduct extensive experiments under various OOD detection setups, demonstrating the effectiveness of our method against its advanced counterparts.

研究の動機と目的

標準的なアウトライア露出（OE）手法に内在するOOD分布のギャップを動機づけ、解決する。
モデル摂動を用いて代理OODデータを暗黙的に多様で未知のようなOOD分布へ変換する新規データ合成手法を提案する。
候補OOD分布全体で一様なOOD検出性能を保証する、WORベースのミニマックス学習目的を開発する。
CIFAR-10、CIFAR-100、ImageNetでDOEを実証的に検証し、難しいOODシナリオを含む最新ベースラインよりOOD検出が向上することを示す。

提案手法

暗黙的データ変換を提案する：データ分布を暗黙的に変換するためにモデル重みを乗法的に摂動させる（定理1、命題1、補題1）。
Worst OOD Regret (WOR) を定義し、現在のOOD性能と候補OOD集合内での最良の可能性との差を測る。
DOEを、摂動に関してWORを最大化し、代理OODデータ上のOE損失を最小化するミニマックス目的として定式化する。
IDと代理OODのミニバッチを用いた確率的実現；勾配ベースの摂動（式7–9）でWORを推定する。
訓練後のOOD検出にMaxLogitスコアリングを採用する（式10）。
tinyImageNet / ImageNet-21K-Pを代理OODデータとするCIFARおよびImageNetで、ポストホックおよびファインチューニングベースラインと比較する。

実験結果

リサーチクエスチョン

RQ1モデル摂動による暗黙的データ変換は代理OODデータを補完する有用なOODデータを生成できるか？
RQ2分布ロバストでWORベースの学習目的は、未知のOOD分布全体でOOD検出を従来のOEおよびDRO手法と比較して一様に改善するか？
RQ3CIFAR-10、CIFAR-100、ImageNetなどの多様なベンチマークと難しいOODシナリオでDOEの利得は一貫して現れるか？

主な発見

DOEはFPR 95（95%の真ID率時の偽陽性率）を低減し、共通のOODベンチマークでAUROCをOEや多くのベースラインと比較して向上させる。
CIFAR-10、CIFAR-100、ImageNetでは、それぞれ元のOEと比較してFPR95を7.26%、20.30%、13.97%低減。
難しいOOD検出設定では、DOEはより大きな改善を達成（例：LSUN-Fix、ImageNet-Resize、CIFAR-100でFPR95をそれぞれ7.45%、7.75%、4.09%低減）。
アブレーション研究は、暗黙的データ変換とWORベース学習の双方がDOEの性能に寄与し、広範な設定で標準DROおよび敵対的訓練ベースラインを上回る。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。