Skip to main content
QUICK REVIEW

[论文解读] Visual tracking with reliable memories

Shu Wang, Shaoting Zhang|arXiv (Cornell University)|Jul 9, 2016
Video Surveillance and Tracking Methods参考文献 35被引用 5
一句话总结

该论文提出了一种基于离散傅里叶变换(DFT)的视觉追踪框架,结合时间约束聚类,从历史帧中发现并存储可靠、一致的模式——称为'可靠记忆',以应对长期追踪中的漂移问题。该方法实现了最先进性能,在大多数现有追踪器失效的4,000帧以上视频中仍能成功追踪。

ABSTRACT

In this paper, we propose a novel visual tracking framework that intelligently discovers patterns from a wide range of video to resist drift error for long-term tracking tasks. First, we design a Discrete Fourier Transform (DFT) based tracker which is able to exploit a large number of tracked samples while still ensures real-time performance. Second, we propose a clustering method with temporal constraints to explore and memorize consistent patterns from previous frames, named as reliable memories. By virtue of this method, our tracker can utilize uncontaminated information to alleviate drifting issues. Experimental results show that our tracker performs favorably against other state-of-the-art methods on benchmark datasets. Furthermore, it is significantly competent in handling drifts and able to robustly track challenging long videos over 4000 frames, while most of others lose track at early frames.

研究动机与目标

  • 为解决长期视觉追踪中持续存在的漂移问题,特别是在存在遮挡和外观变化的挑战性序列中。
  • 开发一种智能提取并保留来自历史帧中一致、未受污染模式的方法,以提升追踪鲁棒性。
  • 在利用长时间视频序列中大量追踪样本的同时,保持实时性能。
  • 实现在4,000帧以上的可靠追踪,这是大多数现有追踪器失效的基准。

提出的方法

  • 设计了一种基于离散傅里叶变换(DFT)的追踪器,以高效处理并实时利用大量追踪样本。
  • 引入一种具有时间约束的聚类方法,用于识别并存储来自先前帧的一致视觉模式,形成'可靠记忆'。
  • 可靠记忆源自追踪器保持高置信度的帧,确保仅保留干净、稳定的特征。
  • 在追踪过程中,追踪器动态检索并利用这些可靠记忆,以纠正漂移并稳定预测。
  • 聚类中的时间约束确保仅选择在一致时间间隔内重复出现的时序一致模式。
  • 将可靠记忆集成到追踪循环中,增强了鲁棒性,同时不损害实时性能。

实验结果

研究问题

  • RQ1追踪框架能否有效从长视频序列中学习并重用一致的视觉模式,以减少漂移?
  • RQ2如何在保持实时效率的前提下,自动从历史帧中发现并存储可靠记忆?
  • RQ3聚类中的时间约束在多大程度上能提升存储视觉模式的质量与相关性?
  • RQ4此类记忆增强型追踪器能否在长期追踪基准上超越最先进方法,特别是在4,000帧以上?

主要发现

  • 所提出的追踪器在标准基准数据集上实现了最先进性能,在长期追踪场景中优于现有方法。
  • 成功追踪了超过4,000帧的序列,相较于大多数现有追踪器更早丢失目标,实现了显著改进。
  • 使用可靠记忆显著减少了漂移,尤其在存在外观变化和遮挡的长期追踪中。
  • 基于DFT的追踪器即使在处理大量追踪样本时,也能保持实时性能。
  • 具有时间约束的聚类方法能有效识别并保留来自历史帧的稳定、一致的视觉模式。
  • 该框架在以往方法因漂移而失效的挑战性追踪场景中表现出鲁棒性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。