[论文解读] Learning Domain Adaptive Object Detection with Probabilistic Teacher
PT 引入一个阈值无、基于不确定性的自训练框架用于无监督领域自适应对象检测。它使用一个概率化的 Faster-RCNN 和一个不断演进的概率教师,联合适应分类、定位和锚框,并结合 Entropy Focal Loss 来强调低熵伪框,达到最先进的结果。
Self-training for unsupervised domain adaptive object detection is a challenging task, of which the performance depends heavily on the quality of pseudo boxes. Despite the promising results, prior works have largely overlooked the uncertainty of pseudo boxes during self-training. In this paper, we present a simple yet effective framework, termed as Probabilistic Teacher (PT), which aims to capture the uncertainty of unlabeled target data from a gradually evolving teacher and guides the learning of a student in a mutually beneficial manner. Specifically, we propose to leverage the uncertainty-guided consistency training to promote classification adaptation and localization adaptation, rather than filtering pseudo boxes via an elaborate confidence threshold. In addition, we conduct anchor adaptation in parallel with localization adaptation, since anchor can be regarded as a learnable parameter. Together with this framework, we also present a novel Entropy Focal Loss (EFL) to further facilitate the uncertainty-guided self-training. Equipped with EFL, PT outperforms all previous baselines by a large margin and achieve new state-of-the-arts.
研究动机与目标
- 在域间变化(天气、尺度、相机、合成到真实)的情況下,推动鲁棒的无监督领域自适应对象检测。
- 开发一个阈值无、自训练框架,利用伪框的不确定性同时用于分类和定位。
- 在一个概率检测器架构中统一分类、定位和锚框适应。
- 提出训练策略(Entropy Focal Loss、锐化、EMA 教师更新)以在没有置信度阈值的情况下提升伪标签质量。
提出的方法
- 将 Faster-RCNN 转换为 Probabilistic Faster-RCNN,其中每个边界框坐标建模为高斯分布,每个类别建模为概率分布。
- 使用 Probabilistic Teacher 从未标记的目标数据生成包含不确定性伪框。
- 训练学生模型,在 RPN 和 ROI 头上对分类和回归应用基于不确定性的一致性损失。
- 通过 EMA 实现锚框自适应,以将锚框形状调整为目标边界框分布。
- 引入 Entropy Focal Loss,以在分类和定位中突出低熵(噪声较少)的伪框。
实验结果
研究问题
- RQ1如何在不使用置信度阈值的情况下利用伪框中的不确定性来改进 UDA-OD?
- RQ2一个 probabilistic teacher-student 框架是否能够在跨域情形下联合自适应分类、定位和锚框?
- RQ3熵引导自训练(EFL)是否进一步提升跨域检测性能?
- RQ4强数据增强和域内对齐在提升 UDA-OD 自训练中的作用是什么?
- RQ5该方法如何扩展到源无 UDA-OD 设置?
主要发现
- Probabilistic Teacher 框架在多个基于源和无源的 UDA-OD 基准上取得了最先进的结果。
- 锚框自适应和 Entropy Focal Loss 都在不同域偏移上带来性能提升。
- 强的数据增强显著提升自训练效果,甚至优于传统域对齐方法。
- 将 PT 扩展到源无设置可带来对基线的显著提升。
- 使用概率检测器在定位不确定性处理方面优于简单的 Faster-RCNN 基线。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。