[論文レビュー] Margin Sample Mining Loss: A Deep Learning Based Method for Person Re-identification
MSML は、バッチ内の hardest positive と hardest negative のペアを選択して訓練する hard-sample margin-based metric learning loss を導入し、人物再識別の埋め込みモデルを訓練する。主要なベンチマークを横断して、いくつかの最先端の losses を上回る。
Person re-identification (ReID) is an important task in computer vision. Recently, deep learning with a metric learning loss has become a common framework for ReID. In this paper, we also propose a new metric learning loss with hard sample mining called margin smaple mining loss (MSML) which can achieve better accuracy compared with other metric learning losses, such as triplet loss. In experi- ments, our proposed methods outperforms most of the state-of-the-art algorithms on Market1501, MARS, CUHK03 and CUHK-SYSU.
研究の動機と目的
- 標準のトリプレット/クアドラプル損失を超える人物 ReID のメトリック学習の改善を動機付ける。
- バッチ内の極めて難しいサンプルを活用するマージン・サンプル・マイニング損失を提案する。
- MSML が主要な ReID ベンチマークで優れた性能を示すことを実証する。
提案手法
- identity ごとに K 枚の画像を含むバッチを構築する(P identities, N=K×P)。
- CNN バックボーンからの埋め込み特徴について N×N の距離行列を計算する。
- hardest positive pair(正例の中で最大距離)と hardest negative pair(負例の中で最小距離)を選択する。
- MSML 損失を L_eml = (max_positive_distance − min_negative_distance + α)+ と定義する。ここで (·)+ はヒンジ。
- エッジマイニングを組み込み、正例と負例が同じアイデンティティを共有するケースとそうでないケースを扱う。
- 学習は Adam を用い、段階的な学習率と標準的なデータ拡張で訓練する。
実験結果
リサーチクエスチョン
- RQ1MSML は既存のメトリック損失と比較して、同一アイデンティティ間および異なるアイデンティティ間の識別性を改善するか。
- RQ2MSML における hard/edge マイニングは、異なるバックボーンネットワークとデータセットで性能にどのような影響を与えるか。
- RQ3MSML は Market1501、MARS、CUHK-SYSU、および CUHK03 で最先端の結果を達成できるか。
- RQ4 triplet/quadruplet 損失と比較した場合、埋め込み空間の構造(距離分布)に及ぼす MSML の影響はどうなるか。
主な発見
| Dataset | Model/Loss | mAP | r=1 | r=5 | r=10 |
|---|---|---|---|---|---|
| Market1501 | MSML (ResNet50) | 69.6 | 85.2 | 93.7 | - |
| Market1501 | MSML (Inception-v2) | 73.4 | 87.7 | 95.2 | - |
| Market1501 | MSML (ResNet50-X) | 76.7 | 88.9 | 95.6 | - |
| MARS | MSML (ResNet50) | 72.0 | 83.0 | 92.6 | - |
| MARS | MSML (Inception-v2) | 74.6 | 84.2 | 95.1 | - |
| MARS | MSML (ResNet50-X) | 72.0 | 83.4 | 93.3 | - |
| CUHK-SYSU | MSML (ResNet50) | 87.2 | 89.3 | 96.4 | - |
| CUHK-SYSU | MSML (Inception-v2) | 88.4 | 90.4 | 96.8 | - |
| CUHK-SYSU | MSML (ResNet50-X) | 89.6 | 90.9 | 97.4 | - |
| CUHK03 | MSML (ResNet50) | 84.0 | 96.7 | 98.2 | - |
- MSML は、テストされたベースモデルとデータセット全体のほとんどの実験で最高精度を達成。
- Market1501 で ResNet50 使用時、MSML は mAP 69.6 と rank-1 85.2 を達成; MARS で mAP 72.0、rank-1 83.0; CUHK-SYSU で mAP 87.2、rank-1 89.3; CUHK03 で mAP 84.0、rank-1 96.7。
- TriHard および Quad と比較して、MSML は構成全体で一貫して優れたまたは競争力のある結果を提供する。
- 距離分布の分析は、MSML が伝統的な triplet ベースの損失よりも正例と負例の分離を明確に示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。