Skip to main content
QUICK REVIEW

[论文解读] Comparative study of histogram distance measures for re-identification

Pedro A. Marín-Reyes, Javier Lorenzo-Navarro|arXiv (Cornell University)|Nov 24, 2016
Advanced Image and Video Retrieval Techniques被引用 11
一句话总结

本文评估了用于行人重识别的直方图距离度量和色彩空间,发现HSV色彩空间中使用16–32个分箱和5–10条水平条带的巴氏距离、卡方距离与交集距离表现最佳。该研究基于多个数据库的实证排名,提供了行人重识别系统经验证的初始配置。

ABSTRACT

Color based re-identification methods usually rely on a distance function to measure the similarity between individuals. In this paper we study the behavior of several histogram distance measures in different color spaces. We wonder whether there is a particular histogram distance measure better than others, likewise also, if there is a color space that present better discrimination features. Several experiments are designed and evaluated in several images to obtain measures against various color spaces. We test in several image databases. A measure ranking is generated to calculate the area under the CMC, this area is the indicator used to evaluate which distance measure and color space present the best performance for the considered databases. Also, other parameters such as the image division in horizontal stripes and number of histogram bins, have been studied.

研究动机与目标

  • 评估不同直方图距离度量在行人重识别任务中的性能。
  • 确定在光照条件变化下,哪种色彩空间能提供更好的区分能力。
  • 分析直方图分箱数量与图像划分为水平条带对重识别准确率的影响。
  • 基于实证评估,建立鲁棒的行人重识别系统初始配置。

提出的方法

  • 本研究使用色彩直方图作为全局图像描述符,计算于多种色彩空间:RGB、HSV、CIELAB与YCbCr。
  • 评估七种直方图距离度量:巴氏距离、卡方距离、相关性、交集距离、L1、L2与Kullback-Leibler散度。
  • 将图像划分为1至20条水平条带,以提取局部色彩直方图,提升空间区分能力。
  • 将直方图归一化为概率分布,以确保尺度不变性。
  • 使用CMC曲线下面积(mAP)衡量性能,结果在四个基准数据库上取平均。
  • 在16种分箱配置与多种色彩空间下进行实验,同时监控执行时间以评估计算效率。

实验结果

研究问题

  • RQ1哪种直方图距离度量在多个数据库上能实现最高的重识别准确率?
  • RQ2哪种色彩空间在光照变化下能提供更优的区分能力?
  • RQ3直方图分箱数量如何影响重识别性能与计算成本?
  • RQ4在基于直方图的重识别中,图像分割为多少条水平条带为最优?
  • RQ5不同距离度量在运行时间与鲁棒性方面表现如何?

主要发现

  • 巴氏距离、卡方距离与交集距离在所有数据库上均持续优于其他度量,实现了最高的CMC曲线下面积。
  • HSV色彩空间的性能显著优于RGB、CIELAB与YCbCr,可能归因于其将亮度与色度分量分离的特性。
  • 使用16至32个直方图分箱可在信息保留与噪声抑制之间达到最佳平衡,分箱数量更大时无显著提升。
  • 将图像划分为5至10条水平条带可改善性能,有效捕捉空间色彩分布;而条带过多则因分箱值稀疏而引入噪声。
  • KL散度因计算过程中的信息损失而表现异常,不适用于本任务。
  • 执行时间随条带数量线性增加,而分箱数量对运行时间的影响则较难预测。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。