[论文解读] Deep Meta Learning for Real-Time Visual Tracking based on Target-Specific Feature Space
该论文提出了一种基于元学习器增强的孪生匹配网络的实时视觉追踪框架,可动态生成针对目标的特征空间。通过单次前向传播实现参数即时更新,该方法消除了迭代优化过程,在保持最先进精度的同时实现了62 fps的推理速度。
In this paper, we propose a novel on-line visual tracking framework based on Siamese matching network and meta-learner network which runs at real-time speed. Conventional deep convolutional feature based discriminative visual tracking algorithms require continuous re-training of classifiers or correlation filters for solving complex optimization tasks to adapt to the new appearance of a target object. To remove this process, our proposed algorithm incorporates and utilizes a meta-learner network to provide the matching network with new appearance information of the target object by adding the target-aware feature space. The parameters for the target-specific feature space are provided instantly from a single forward-pass of the meta-learner network. By eliminating the necessity of continuously solving the complex optimization tasks in the course of tracking, experimental results demonstrate that our algorithm performs at a real-time speed of $62$ fps while maintaining a competitive performance among other state-of-the-art tracking algorithms.
研究动机与目标
- 为解决深度视觉追踪中因持续微调分类器或相关滤波器而产生的计算瓶颈问题。
- 通过实现对目标外观变化的快速适应,消除追踪过程中对复杂优化的依赖。
- 在不牺牲追踪精度的前提下,实现真正的实时推理速度。
- 引入一种目标感知的特征空间,该空间通过元学习器网络动态生成。
提出的方法
- 集成元学习器网络,实现实时生成针对目标的特征空间参数。
- 使用孪生匹配网络比较模板区域与搜索区域的特征,以实现目标定位。
- 通过元学习器的单次前向传播,实现在目标外观变化时即时更新特征空间参数。
- 构建一种目标感知的特征空间,可无需迭代优化即可适应新外观。
- 利用元学习器在不同目标外观间泛化的能力,实现快速适应。
- 设计框架以避免在线追踪过程中重新训练或求解复杂优化问题。
实验结果
研究问题
- RQ1元学习器网络是否能够在无需迭代优化的情况下实现实时特征空间参数自适应?
- RQ2所提出的方法在实现实时推理速度的同时,如何保持高追踪精度?
- RQ3针对目标的特征空间在外观变化下对追踪鲁棒性的提升程度如何?
- RQ4元学习的集成是否能够降低传统深度追踪框架的计算开销?
主要发现
- 所提方法实现了62 fps的实时推理速度,显著优于依赖迭代优化的方法。
- 尽管消除了复杂的优化步骤,该框架在追踪性能上仍与最先进算法保持相当水平。
- 元学习器通过单次前向传播即可实现目标特定特征空间的参数即时生成。
- 通过消除持续微调或优化过程,实现了更快的推理速度,且未牺牲精度。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。