Skip to main content
QUICK REVIEW

[论文解读] Adaptive Decontamination of the Training Set: A Unified Formulation for Discriminative Visual Tracking

Martin Danelljan, G Hager|arXiv (Cornell University)|Sep 20, 2016
Video Surveillance and Tracking Methods参考文献 20被引用 36
一句话总结

本文提出一种统一的联合学习公式,通过同时优化外观模型和样本质量权重,自适应地净化判别性视觉跟踪中的训练集。通过最小化单一损失函数,该方法对污染样本(如错位、遮挡)进行降权处理,对准确样本进行加权,从而在OTB-2015上实现SOTA性能,平均重叠精度提升3.8%。

ABSTRACT

Tracking-by-detection methods have demonstrated competitive performance in recent years. In these approaches, the tracking model heavily relies on the quality of the training set. Due to the limited amount of labeled training data, additional samples need to be extracted and labeled by the tracker itself. This often leads to the inclusion of corrupted training samples, due to occlusions, misalignments and other perturbations. Existing tracking-by-detection methods either ignore this problem, or employ a separate component for managing the training set. We propose a novel generic approach for alleviating the problem of corrupted training samples in tracking-by-detection frameworks. Our approach dynamically manages the training set by estimating the quality of the samples. Contrary to existing approaches, we propose a unified formulation by minimizing a single loss over both the target appearance model and the sample quality weights. The joint formulation enables corrupted samples to be down-weighted while increasing the impact of correct ones. Experiments are performed on three benchmarks: OTB-2015 with 100 videos, VOT-2015 with 60 videos, and Temple-Color with 128 videos. On the OTB-2015, our unified formulation significantly improves the baseline, with a gain of 3.8% in mean overlap precision. Finally, our method achieves state-of-the-art results on all three datasets. Code and supplementary material are available at http://www.cvl.isy.liu.se/research/objrec/visualtracking/decontrack/index.html .

研究动机与目标

  • 解决基于检测的跟踪框架中因训练样本污染导致的模型漂移与跟踪失败问题。
  • 克服现有方法忽略样本污染或使用启发式、独立组件进行训练集管理的局限性。
  • 开发一种通用的端到端公式,将样本质量估计整合到主要学习目标中。
  • 消除判别性跟踪器中对显式、启发式训练样本管理组件的需求。

提出的方法

  • 构建一个统一的优化问题,通过在外观模型参数和样本质量权重上最小化单一损失函数。
  • 引入可学习的样本权重,动态反映每个训练样本基于其对齐度和外观一致性程度的可靠性。
  • 使用联合损失函数,结合分类/回归损失与样本权重的正则化,使污染样本能自动被降权。
  • 将该公式应用于标准判别性学习方法(如SVM和岭回归),使其具备通用性并可无缝集成到现有跟踪器中。
  • 在每一帧中通过在线学习同时更新模型参数和样本权重,实现实时适应跟踪挑战。
  • 利用联合优化隐式地对训练集进行去污染,无需额外的检测或过滤模块。

实验结果

研究问题

  • RQ1统一的学习公式能否联合优化外观模型与样本质量权重,从而提升跟踪鲁棒性?
  • RQ2将样本质量估计集成到主要学习目标中,是否优于使用独立、启发式样本管理组件的现有方法?
  • RQ3联合学习在多大程度上可减轻错位或遮挡等污染样本的影响?
  • RQ4该方法能否在多样化的跟踪基准上泛化,并有效应对遮挡、形变与尺度变化等挑战性属性?

主要发现

  • 与基线相比,该方法在OTB-2015基准上实现了3.8%的平均重叠精度绝对提升。
  • 在OTB-2015上,该跟踪器的AUC得分为63.4%,优于所有其他方法,包括SRDCF(60.5%)和HCF(56.6%)。
  • 在VOT-2015上,该方法实现了0.299的期望平均重叠(EAO)得分,超过次优跟踪器SRDCF(0.288)。
  • 在Temple-Color数据集上,该方法实现了65.8%的平均重叠精度,优于此前SOTA的62.2%(MEEM和SRDCF)。
  • 该方法在OTB-2015的全部11项属性上均表现出一致改进,尤其在遮挡、背景杂波和非平面旋转等场景中表现突出。
  • 定性结果表明,该跟踪器能成功降低污染样本(如Girl视频第271帧)的权重,从而在遮挡后实现准确的重新检测。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。