Skip to main content
QUICK REVIEW

[论文解读] Conditional Gaussian Distribution Learning for Open Set Recognition

Xin Sun, Zhenning Yang|arXiv (Cornell University)|Mar 19, 2020
Domain Adaptation and Few-Shot Learning参考文献 39被引用 37
一句话总结

本文提出 CGDL,一种条件高斯分布学习框架,配备概率性梯级网络,用于在开放集识别中同时检测未知样本和对已知类别进行分类,达到最先进的性能。

ABSTRACT

Deep neural networks have achieved state-of-the-art performance in a wide range of recognition/classification tasks. However, when applying deep learning to real-world applications, there are still multiple challenges. A typical challenge is that unknown samples may be fed into the system during the testing phase and traditional deep neural networks will wrongly recognize the unknown sample as one of the known classes. Open set recognition is a potential solution to overcome this problem, where the open set classifier should have the ability to reject unknown samples as well as maintain high classification accuracy on known classes. The variational auto-encoder (VAE) is a popular model to detect unknowns, but it cannot provide discriminative representations for known classification. In this paper, we propose a novel method, Conditional Gaussian Distribution Learning (CGDL), for open set recognition. In addition to detecting unknown samples, this method can also classify known samples by forcing different latent features to approximate different Gaussian models. Meanwhile, to avoid information hidden in the input vanishing in the middle layers, we also adopt the probabilistic ladder architecture to extract high-level abstract features. Experiments on several standard image datasets reveal that the proposed method significantly outperforms the baseline method and achieves new state-of-the-art results.

研究动机与目标

  • 开发一个端到端的开放集识别方法,能够同时检测未知样本和对已知类别进行分类。
  • 通过强制后验潜在变量逼近类别特定的高斯模型来学习类别条件的潜在表示。
  • 通过概率梯级架构保持高层次的抽象特征,以提升潜在空间中的判别能力。
  • 结合重建信息与潜在分布来提升对未知样本的检测。
  • 在标准图像数据集(MNIST、SVHN、CIFAR 系列)上展示最先进的性能。

提出的方法

  • 学习条件后验分布 qφ(z|x,k),使其逼近类别特定的高斯先验 pθ^(k)(z) = N(z; μk, I)。
  • 使用全连接层将独热编码的类别标签映射到潜在空间的均值 μk。
  • 在编码器和解码器中采用概率梯级网络,以捕捉高层次的抽象特征并实现层之间的信息流。
  • 使用联合损失进行训练:重建损失 Lr、KL 散度 LKL(包含中间层的 KL 项),以及分类损失 Lc;总损失 L = - (Lr + β LKL + λ Lc)。
  • 在测试阶段,基于正确分类样本的潜在表示建模每个类别的高斯分布 f_k(z) = N(z; mk, σk^2),并将重建误差作为额外的未知检测线索。
  • 通过将基于 CGD 的似然与重建误差阈值 τl 和 τr 结合来检测未知样本,如测试算法所述。

实验结果

研究问题

  • RQ1条件高斯潜在先验是否能够在一个端到端框架中同时实现开放集检测和闭集分类?
  • RQ2将概率梯级架构引入是否有助于保留高层特征并提升相对于传统变分自编码器的开放集性能?
  • RQ3在 CGDL 中将潜在模型的未知检测与重建线索结合使用的有效性如何?
  • RQ4与标准 CNN 基线相比,学习类别条件的潜在分布对闭集准确率有何影响?
  • RQ5CGDL 在 MNIST、SVHN 和 CIFAR 数据集上的标准 OSR 基准测试中的表现如何?

主要发现

方法MNISTSVHNCIFAR10CIFAR+10CIFAR+50
Softmax0.768 ± 0.0080.725 ± 0.0120.600 ± 0.0370.701 ± 0.0120.637 ± 0.008
Openmax [4]0.798 ± 0.0180.737 ± 0.0110.623 ± 0.0380.731 ± 0.0620.676 ± 0.056
CROSR [37]0.803 ± 0.0130.753 ± 0.0190.668 ± 0.0130.769 ± 0.0160.684 ± 0.005
GDFR [24]0.821 ± 0.0210.716 ± 0.0100.700 ± 0.0240.776 ± 0.0030.683 ± 0.023
CGDL (Ours)0.837 ± 0.0550.776 ± 0.0400.655 ± 0.0230.760 ± 0.0240.695 ± 0.013
  • CGDL 在若干标准图像数据集上实现了最先进的开放集识别性能。
  • 相比于普通 CVAEs,概率梯级架构提升了潜在表示质量和开放集分数。
  • 条件高斯分布在对已知类别实现可辨别的潜在表示的同时,能够检测未知样本。
  • 在消融研究中,将重建误差线索加入到基于 CGD 的检测器中进一步提升了性能。
  • 在 Table 2 上,CGDL (Ours) 在 MNIST 上达到 0.837±0.055,在 SVHN 上达到 0.776±0.040,在 CIFAR10 上达到 0.655±0.023,在 CIFAR+10 上达到 0.760±0.024,在 CIFAR+50 上达到 0.695±0.013,优于若干基线。
  • CGDL 在带有 Omniglot/Noise 离群值的 MNIST 上以及在带离群值的 CIFAR-10 上也显示出强劲的结果,达到列出方法中最佳的 macro-F1 分数。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。