[论文解读] Unseen Class Discovery in Open-world Classification
本文提出一个联合开放分类网络(OCN)和成对分类网络(PCN),利用已知类别知识,在被拒绝的开放世界样本中通过层次聚类发现并聚类未见类别,聚类由学习到的同/不同对距离引导。
This paper concerns open-world classification, where the classifier not only needs to classify test examples into seen classes that have appeared in training but also reject examples from unseen or novel classes that have not appeared in training. Specifically, this paper focuses on discovering the hidden unseen classes of the rejected examples. Clearly, without prior knowledge this is difficult. However, we do have the data from the seen training classes, which can tell us what kind of similarity/difference is expected for examples from the same class or from different classes. It is reasonable to assume that this knowledge can be transferred to the rejected examples and used to discover the hidden unseen classes in them. This paper aims to solve this problem. It first proposes a joint open classification model with a sub-model for classifying whether a pair of examples belongs to the same or different classes. This sub-model can serve as a distance function for clustering to discover the hidden classes of the rejected examples. Experimental results show that the proposed model is highly promising.
研究动机与目标
- 解决测试数据可能属于在训练期间未见的未见类别的开放世界分类问题。
- 在开放分类器的拒绝样本中实现隐藏未见类别的发现,而无需人工标注。
- 将从已知类别学习的相似性知识转移到未见类别,以指导聚类。
提出的方法
- 训练由开放分类网络(OCN)和成对分类网络(PCN)组成、共享表示的联合模型。
- OCN 使用基于 DOC 的一对多 sigmoid 输出进行标准的开放分类并对未见类别进行拒绝。
- PCN 使用两个相同的 CNN 分支学习一个二元同/异类判定器,用于成对样本。
- 层次聚类(完全连接)使用 PCN 距离作为聚类度量来发现未见类别簇。
- 同时训练一个自编码器,以提供无监督表示并防止对已见类别的过拟合。
- 使用基于验证的阈值 theta 来确定聚类的停止准则,确保未见簇的数量正确。
- 训练数据:(i)用于 OCN 的开放分类数据,(ii)用于 PCN 的已见-已见对,(iii)用于自编码器的未标记数据;损失 L_OCN、L_PCN 和 L_ae 共同优化。
实验结果
研究问题
- RQ1开放世界分类器是否能够拒绝未见类别样本并为聚类未见样本提供有意义的距离函数?
- RQ2从已知类别学习并转移的相似性(距离)函数是否能引导层次聚类揭示隐藏未见类别的数量?
- RQ3将 OCN+PCN+HC 的联合流程在开放世界设定中发现并聚类未见类别的效果如何?
主要发现
- OCN 在 MNIST 和 EMNIST 数据集上对未见类别样本的拒绝效果持续优于 OpenMax。
- PCN 将从已见类别学到的类内/类间相似性转移到未见类别对,在 seen-seen、seen-unseen 和 unseen-unseen 对上达到合理的准确率。
- 使用 PCN 作为距离函数的层次聚类几乎可以恢复 MNIST 和 EMNIST 未见集合上的真实未见簇数量;在对拒绝样本(嘈杂的)进行聚类时,该方法依然鲁棒。
- 与 Encoder+HC 相比,PCN+HC 获得显著更好的簇数准确性,尤其在 EMNIST 上,证明了 PCN 学得的距离的好处。
- 给定真实簇数时,K-means 可以实现更高的聚类质量,但不能推断簇的数量,而 PCN+HC 可以估计簇的数量,然后使 K-means 对簇进行细化。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。