QUICK REVIEW

[論文レビュー] Conditional Gaussian Distribution Learning for Open Set Recognition

Xin Sun, Zhenning Yang|arXiv (Cornell University)|Mar 19, 2020

Domain Adaptation and Few-Shot Learning参考文献 39被引用数 37

ひとこと要約

この論文は、条件付きガウス分布学習フレームワーク CGDL を提案し、確率的はしごネットワークを用いてオープンセット認識において未知サンプルの検出と既知クラスの分類を同時に実現し、最先端の結果を達成します。

ABSTRACT

Deep neural networks have achieved state-of-the-art performance in a wide range of recognition/classification tasks. However, when applying deep learning to real-world applications, there are still multiple challenges. A typical challenge is that unknown samples may be fed into the system during the testing phase and traditional deep neural networks will wrongly recognize the unknown sample as one of the known classes. Open set recognition is a potential solution to overcome this problem, where the open set classifier should have the ability to reject unknown samples as well as maintain high classification accuracy on known classes. The variational auto-encoder (VAE) is a popular model to detect unknowns, but it cannot provide discriminative representations for known classification. In this paper, we propose a novel method, Conditional Gaussian Distribution Learning (CGDL), for open set recognition. In addition to detecting unknown samples, this method can also classify known samples by forcing different latent features to approximate different Gaussian models. Meanwhile, to avoid information hidden in the input vanishing in the middle layers, we also adopt the probabilistic ladder architecture to extract high-level abstract features. Experiments on several standard image datasets reveal that the proposed method significantly outperforms the baseline method and achieves new state-of-the-art results.

研究の動機と目的

未知サンプルを同時に検出し、既知クラスを分類するエンドツーエンドのオープンセット認識手法を開発する。
posterior latents をクラス特異的 Gaussian モデルに近づけるようにして、クラス条件付き潜在表現を学習する。
確率的はしごアーキテクチャを介して高次の抽象特徴を保持し、潜在空間での識別性を向上させる。
復元情報と潜在分布を組み合わせて未知検出を強化する。
標準画像データセット（MNIST、SVHN、CIFAR 系列）で最先端の性能を示す。

提案手法

qφ(z|x,k) がクラス特異的なガウス事前分布 pθ^(k)(z) = N(z; μk, I) を近づける条件付き後方分布を学習する。
ワンホットクラスラベルを潜在空間の平均 μk に写像する全結合層を使用する。
encoder と decoder の双方に確率的はしごネットワークを採用し、高レベルの抽象特徴を捉え、層間の情報流を可能にする。
再構成誤差 Lr、KL-divergence LKL（中間層のKL項を含む）、分類誤差 Lc の結合損失で訓練する；総損失は L = - (Lr + β LKL + λ Lc)。
テスト時には、正しく分類されたサンプルの潜在表現から per-class Gaussian f_k(z) = N(z; m_k, σ_k^2) を推定し、再構成誤差を未知検出の追加手掛かりとして用いる。
テストアルゴリズムに記載されたように、CGD ベースの尤度と再構成誤差閾値 τl と τr を組み合わせて未知を検出する。

実験結果

リサーチクエスチョン

RQ1 条件付けられたガウス潜在事前分布は、エンドツーエンドのフレームワーク内でオープンセット検出とクローズドセット分類を同時に可能にするか？
RQ2 確率的はしごアーキテクチャを組み込むと、高次機能を保持し従来の VAE よりオープンセット性能が改善されるか？
RQ3 CGDL における潜在モデルベースの未知検出と再構成に基づく手掛かりを組み合わせることはどの程度有効か？
RQ4 クラス条件付き潜在分布を学ぶことは、標準の CNN ベースのベースラインと比較してクローズドセットの精度に影響を与えるか？
RQ5 CGDL は MNIST、SVHN、および CIFAR データセットにおける標準 OSR ベンチマークでどの程度の性能を示すか？

主な発見

手法	MNIST	SVHN	CIFAR10	CIFAR+10	CIFAR+50
Softmax	0.768 ± 0.008	0.725 ± 0.012	0.600 ± 0.037	0.701 ± 0.012	0.637 ± 0.008
Openmax [4]	0.798 ± 0.018	0.737 ± 0.011	0.623 ± 0.038	0.731 ± 0.062	0.676 ± 0.056
CROSR [37]	0.803 ± 0.013	0.753 ± 0.019	0.668 ± 0.013	0.769 ± 0.016	0.684 ± 0.005
GDFR [24]	0.821 ± 0.021	0.716 ± 0.010	0.700 ± 0.024	0.776 ± 0.003	0.683 ± 0.023
CGDL (Ours)	0.837 ± 0.055	0.776 ± 0.040	0.655 ± 0.023	0.760 ± 0.024	0.695 ± 0.013

CGDL はいくつかの標準的な画像データセットでオープンセット認識の最先端性能を達成する。
確率的はしごアーキテクチャは、通常の CVAE より潜在表現の質とオープンセットスコアを改善する。
条件付きガウス分布は既知クラスの識別的な潜在表現を実現しつつ、未知検出を可能にする。
復元誤差の手掛かりを CGD ベースの検出器に加えると、アブレーション実験で性能がさらに向上する。
Table 2 において、CGDL (Ours) は MNIST で 0.837 ± 0.055、SVHN で 0.776 ± 0.040、CIFAR10 で 0.655 ± 0.023、CIFAR+10 で 0.760 ± 0.024、CIFAR+50 で 0.695 ± 0.013 を達成し、いくつかのベースラインを上回る。
CGDL は Omniglot/ノイズ外れ値を含む MNIST や外れ値を含む CIFAR-10 でも良好な結果を示し、挙げられた手法の中で最良の macro-F1 スコアを達成する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。