QUICK REVIEW

[论文解读] Margin Sample Mining Loss: A Deep Learning Based Method for Person Re-identification

Qiqi Xiao, Hao Luo|arXiv (Cornell University)|Oct 2, 2017

Video Surveillance and Tracking Methods参考文献 44被引用 131

一句话总结

MSML 引入了一种基于硬样本的边际学习损失，在一个批次内选择最难的正样本对和最难的负样本对来训练用于人员再识别的嵌入模型，在主要基准上优于多种最先进的损失函数。

ABSTRACT

Person re-identification (ReID) is an important task in computer vision. Recently, deep learning with a metric learning loss has become a common framework for ReID. In this paper, we also propose a new metric learning loss with hard sample mining called margin smaple mining loss (MSML) which can achieve better accuracy compared with other metric learning losses, such as triplet loss. In experi- ments, our proposed methods outperforms most of the state-of-the-art algorithms on Market1501, MARS, CUHK03 and CUHK-SYSU.

研究动机与目标

推动超越标准三元/四元损失的人员 ReID 的改进度量学习。
提出一种利用同批次中极其困难样本的边 margin 采样挖掘损失。
证明 MSML 在主要 ReID 基准上具有优越表现。

提出的方法

构建一个每个身份包含 K 张图像的批次（P 个身份，N=K×P）。
对来自 CNN 主干的嵌入特征计算 N×N 的距离矩阵。
选择最难的正样本对（正样本对中的最大距离）和最难的负样本对（负样本对中的最小距离）。
将 MSML 损失定义为 L_eml = (max_positive_distance − min_negative_distance + α)+，其中 (·)+ 为铰链函数。
通过处理正负样本对是否共享身份等情况来纳入边缘挖掘。
使用 Adam 进行分阶段学习率和标准数据增强进行训练。

实验结果

研究问题

RQ1与现有度量损失相比，MSML 是否提高了同一身份与不同身份对之间的判别能力？
RQ2MSML 的硬样本/边缘挖掘对不同主干网络和数据集的性能影响如何？
RQ3MSML 是否能够在 Market1501、MARS、CUHK-SYSU 和 CUHK03 上达到最先进的结果？
RQ4与三元/四元损失相比，MSML 对嵌入空间结构（距离分布）的影响是什么？

主要发现

MSML 在所测试的基础模型和数据集的多数实验中达到最佳准确率。
在 Market1501 的 ResNet50 下，MSML 的 mAP 为 69.6、rank-1 为 85.2；在 MARS 为 mAP 72.0、rank-1 为 83.0；在 CUHK-SYSU 为 mAP 87.2、rank-1 为 89.3；在 CUHK03 为 mAP 84.0、rank-1 为 96.7。
相较于 TriHard 和 Quad，MSML 在各种配置下始终提供更优或具竞争力的结果。
距离分布分析表明，MSML 相较于传统的基于三元组的损失，在正负对之间的分离更为明显。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。