QUICK REVIEW

[论文解读] Recognition in Unseen Domains: Domain Generalization via Universal Non-volume Preserving Models.

Thanh-Dat Truong, Chi Nhan Duong|arXiv (Cornell University)|May 28, 2019

Domain Adaptation and Few-Shot Learning参考文献 23被引用 2

一句话总结

本文提出一种用于深度学习领域泛化的通用非体积保持（NVP）模型，可在无需微调的情况下实现对未见领域的识别。通过利用归一化流学习领域不变表示，该方法在包括MNIST、人脸识别和热成像行人识别在内的多种数据集上均实现了稳定的准确率提升。

ABSTRACT

Recognition across domains has recently become an active topic in the research community. However, it has been largely overlooked in the problem of recognition in new unseen domains. Under this condition, the delivered deep network models are unable to be updated, adapted or fine-tuned. Therefore, recent deep learning techniques, such as: domain adaptation, feature transferring, and fine-tuning, cannot be applied. This paper presents a novel approach to the problem of domain generalization in the context of deep learning. The proposed method is evaluated on different datasets in various problems, i.e. (i) digit recognition on MNIST, SVHN and MNIST-M, (ii) face recognition on Extended Yale-B, CMU-PIE and CMU-MPIE, and (iii) pedestrian recognition on RGB and Thermal image datasets. The experimental results show that our proposed method consistently improves the performance accuracy. It can be also easily incorporated with any other CNN frameworks within an end-to-end deep network design for object detection and recognition problems to improve their performance.

研究动机与目标

解决在无法更新模型或进行微调的情况下识别未见领域数据的挑战。
开发一种不依赖领域特定适应的领域泛化方法，以实现对多样化数据分布的泛化。
实现在存在未知或未见领域偏移的实际场景中部署深度学习模型。
确保与现有CNN框架兼容，以实现目标检测和识别任务中的端到端集成。

提出的方法

利用通用非体积保持（NVP）流，在多个领域间学习领域不变的特征表示。
应用归一化流来建模复杂、非线性的变换，同时保持可逆性及似然计算能力。
端到端训练模型，以分离领域特定的差异与共享的不变特征。
设计网络结构以兼容标准CNN主干网络，实现与现有识别流程的无缝集成。
采用领域不变表示学习目标，促使特征对领域偏移保持不变。
通过重建损失与领域不变性正则化相结合的方式优化模型。

实验结果

研究问题

RQ1基于通用NVP的模型是否能在无需微调或适应的情况下有效泛化到未见领域？
RQ2所提出方法在包括数字识别、人脸识别和行人识别在内的多样化识别任务中表现如何？
RQ3与现有领域泛化基线相比，该模型在准确率提升方面达到何种程度？
RQ4该方法在端到端识别系统中与标准CNN架构的集成效果如何？

主要发现

所提方法在所有评估数据集上均一致提升了识别准确率，包括MNIST、SVHN、MNIST-M、Extended Yale-B、CMU-PIE、CMU-MPIE以及RGB/TIR行人数据集。
即使在推理阶段无法访问领域特定数据的情况下，该模型在未见领域中的表现仍优于现有领域泛化技术。
该方法在多样化数据分布（包括RGB与热成像等跨模态设置）中展现出强大的泛化能力。
将基于NVP的模块与标准CNN结合，可在端到端识别任务中带来可测量的性能提升。
该方法在显著领域偏移下仍保持鲁棒性，表明其有效分离了领域不变特征。
该方法易于扩展，并与现有深度学习框架兼容，适用于目标检测和识别任务。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。