Skip to main content
QUICK REVIEW

[论文解读] Learning to rank in person re-identification with metric ensembles

Sakrapee Paisitkriangkrai, Chunhua Shen|arXiv (Cornell University)|Mar 5, 2015
Video Surveillance and Tracking Methods参考文献 7被引用 55
一句话总结

本文提出一种结构化学习方法,将多种手工设计与深度视觉特征整合到集成度量系统中,用于行人重识别。通过同时优化相对排序(通过三元组损失)和top-k识别准确率,该方法实现了最先进性能,在CUHK03数据集上将rank-1准确率提升高达41个百分点(从21%提升至62.1%)。

ABSTRACT

We propose an effective structured learning based approach to the problem of person re-identification which outperforms the current state-of-the-art on most benchmark data sets evaluated. Our framework is built on the basis of multiple low-level hand-crafted and high-level visual features. We then formulate two optimization algorithms, which directly optimize evaluation measures commonly used in person re-identification, also known as the Cumulative Matching Characteristic (CMC) curve. Our new approach is practical to many real-world surveillance applications as the re-identification performance can be concentrated in the range of most practical importance. The combination of these factors leads to a person re-identification system which outperforms most existing algorithms. More importantly, we advance state-of-the-art results on person re-identification by improving the rank-$1$ recognition rates from $40\%$ to $50\%$ on the iLIDS benchmark, $16\%$ to $18\%$ on the PRID2011 benchmark, $43\%$ to $46\%$ on the VIPeR benchmark, $34\%$ to $53\%$ on the CUHK01 benchmark and $21\%$ to $62\%$ on the CUHK03 benchmark.

研究动机与目标

  • 解决监控系统中因显著外观差异、姿态变化和光照差异带来的行人重识别挑战。
  • 通过学习不同数据集下的最优特征权重,克服度量集成中固定权重融合的局限性。
  • 通过聚焦top-k检索(例如k < 10)来提升实际应用中的重识别性能,这与真实操作人员的行为一致。
  • 构建一个灵活的框架,可与线性和非线性度量学习方法兼容。
  • 通过结构化学习整合多样化视觉特征,在多个基准数据集上实现最先进性能。

提出的方法

  • 利用多种低级和高级视觉特征(包括颜色直方图、LBP、SIFT和纹理特征)构建基础度量的集成。
  • 采用两种结构化学习目标优化特征权重:(1) 基于三元组的相对距离最大化,以提升排序顺序;(2) 针对小k值(例如k=1至10)的top-k识别率最大化。
  • 应用切平面优化方法,高效求解基于top-k识别率的结构化学习问题。
  • 将样本间距离归一化至[0,1]区间,以确保不同基于特征的距离函数具有统一尺度。
  • 采用加权平均基础度量的方法,其中权重通过优化学习获得,而非预先定义。
  • 将集成框架与现有度量学习技术结合,支持与线性及非线性模型的兼容。

实验结果

研究问题

  • RQ1基于学习的多视觉特征融合是否能超越固定权重集成方法,进一步提升行人重识别性能?
  • RQ2优化top-k识别(例如rank-1至rank-10)是否相比优化整体CMC形状,具有更好的实际应用价值?
  • RQ3与均匀或启发式权重分配相比,基于三元组和top-k目标的结构化学习在度量集成中表现如何?
  • RQ4度量集成学习在iLIDS、VIPeR和CUHK03等挑战性基准数据集上,能将rank-1准确率提升至何种程度?
  • RQ5所提出的框架是否足够灵活,可与现有度量学习算法结合而不损害性能?

主要发现

  • 在iLIDS上,该方法实现50.3%的rank-1识别率,相比之前工作的40.3%有所提升。
  • 在PRID2011上,该方法实现17.9%的rank-1准确率,高于此前最优方法的16.0%。
  • 在VIPeR上,rank-1准确率达到45.9%,优于之前最先进方法的43.4%。
  • 在CUHK01上,该方法实现53.4%的rank-1准确率,显著优于之前最佳的34.3%。
  • 在CUHK03上,该方法实现62.1%的rank-1准确率,较之前最佳的20.7%有显著提升。
  • CMC${}^\text{top}$优化在低召回率下(k ≤ 10)优于基线均匀加权方法,而两者在高召回率下(k ≥ 50)趋于收敛。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。