Skip to main content
QUICK REVIEW

[论文解读] Unsupervised Domain Adaptive Re-Identification: Theory and Practice

Liangchen Song, Cheng Wang|arXiv (Cornell University)|Jul 30, 2018
Domain Adaptation and Few-Shot Learning参考文献 16被引用 66
一句话总结

本文提出一个以理论为指导的无监督领域自适应再识别框架,引入特征空间假设和利用聚类生成伪标签的自训练方案,在人和车辆再识别任务上进行了验证。

ABSTRACT

We study the problem of unsupervised domain adaptive re-identification (re-ID) which is an active topic in computer vision but lacks a theoretical foundation. We first extend existing unsupervised domain adaptive classification theories to re-ID tasks. Concretely, we introduce some assumptions on the extracted feature space and then derive several loss functions guided by these assumptions. To optimize them, a novel self-training scheme for unsupervised domain adaptive re-ID tasks is proposed. It iteratively makes guesses for unlabeled target data based on an encoder and trains the encoder based on the guessed labels. Extensive experiments on unsupervised domain adaptive person re-ID and vehicle re-ID tasks with comparisons to the state-of-the-arts confirm the effectiveness of the proposed theories and self-training framework. Our code is available at \url{https://github.com/LcDog/DomainAdaptiveReID}.

研究动机与目标

  • 通过将输入空间假设适配到成对特征空间,扩展无监督领域自适应理论到再识别任务。
  • 引入三种特征空间假设(协变量漂移、Separately Probabilistic Lipschitzness、weight ratio),并推导相应的损失。
  • 提出一个自训练框架,利用伪标签迭代地优化编码器。
  • 设计基于聚类和距离的策略来选择高置信度的目标样本用于训练。
  • 在大规模的人和车辆再识别数据集上展示效果。

提出的方法

  • 将协变量漂移适配到成对的再识别标签。
  • 为特征对定义 Separately Probabilistic Lipschitzness (SPL),并推导簇内/簇间损失(L_intra, L_inter)。
  • 引入基于权重比的损失(L_WR)以对齐源/目标特征分布。
  • 使用结合基于Jaccard的相似性(d_J)和目标到源的接近性项(d_W)的距离度量,形成用于聚类的联合矩阵M。
  • 对距离矩阵执行 DBSCAN 聚类以选择伪标签的目标样本。
  • 在选定的伪标签数据上使用三元组损失进行训练,并迭代更新编码器。

实验结果

研究问题

  • RQ1三种特征空间假设(协变量漂移、SPL、weight ratio)是否能为无监督域自适应再识别提供可学习性保证?
  • RQ2如何在迭代自训练框架中训练编码器以满足SPL并利用权重比?
  • RQ3基于聚类的伪标签策略是否在跨域再识别中优于直接迁移和简单自训练?
  • RQ4所提出的距离度量和聚类方法(使用 DBSCAN 与 k-reciprocal 编码)在跨域的人和车辆再识别任务中有多有效?

主要发现

  • 在三种特征空间假设下的无监督域自适应再识别的理论保证。
  • 一个自训练框架,利用聚类得到的伪标签迭代地细化编码器。
  • 将 d_J 与 d_W 结合的距离度量方案提升了簇聚性和伪标签质量。
  • 在基于人再识别基准测试(如跨数据集设置)上,相较直接迁移、基线自训练以及若干最先进的再识别方法,取得了经验上的提升。
  • 框架成功推广并验证于车辆再识别数据集,展示跨域的泛用性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。