Skip to main content
QUICK REVIEW

[論文レビュー] Hierarchical Clustering with Hard-batch Triplet Loss for Person Re-identification

Kaiwei Zeng|arXiv (Cornell University)|Oct 27, 2019
Video Surveillance and Tracking Methods参考文献 34被引用数 32
ひとこと要約

本論文では、階層的クラスタリングとハードバッチトリプレット損失を組み合わせることで高品質な偽ラベルを生成する、完全に教師なしの人物再識別手法HCTを提案する。PKサンプリングとハードバッチトリプレット学習を繰り返し適用することで、偽ラベルを段階的に改善し、Market-1501で56.4% mAP、DukeMTMC-reIDで50.7% mAPを達成した。これは、最先端の教師なし手法を上回り、多くの教師ありドメイン適応手法でさえも上回る性能を発揮した。

ABSTRACT

For most unsupervised person re-identification (re-ID), people often adopt unsupervised domain adaptation (UDA) method. UDA often train on the labeled source dataset and evaluate on the target dataset, which often focuses on learning differences between the source dataset and the target dataset to improve the generalization of the model. Base on these, we explore how to make use of the similarity of samples to conduct a fully unsupervised method which just trains on the unlabeled target dataset. Concretely, we propose a hierarchical clustering-guided re-ID (HCR) method. We use hierarchical clustering to generate pseudo labels and use these pseudo labels as monitors to conduct the training. In order to exclude hard examples and promote the convergence of the model, We use PK sampling in each iteration, which randomly selects a fixed number of samples from each cluster for training. We evaluate our model on Market-1501, DukeMTMC-reID and MSMT17. Results show that HCR gets the state-of-the-arts and achieves 55.3% mAP on Market-1501 and 46.8% mAP on DukeMTMC-reID. Our code will be released soon.

研究の動機と目的

  • クラスタリングによって生成される低品質な偽ラベルが原因で、完全に教師なしの再識別手法の性能が低下する問題に対処すること。
  • ターゲットドメイン内のサンプル間類似度を活用することで、階層的クラスタリングにより偽ラベルの品質を向上させること。
  • 同じ外見の異なるアイデンティティのサンプル(ハード例)がクラスタリングと学習に与える悪影響を軽減すること。
  • 繰り返し偽ラベルを再初期化し、ハードバッチトリプレット損失で微調整することで、モデルの収束性と性能を向上させること。
  • 手動でアノテートされたソースデータを一切使用せずに、完全に教師なし再識別で最先端の性能を達成すること。

提案手法

  • 階層的クラスタリングを用いて、特徴の類似度に基づいてターゲットデータセットのサンプルをクラスタにグループ化する。初期段階では各サンプルを単一クラスタとして扱う。
  • 各イテレーションにおいて、クラスタ間距離に基づいて固定数のクラスタを統合し、学習用の偽ラベルを生成する。
  • PKサンプリングを適用し、K個のアイデンティティから各々P個の正例を選び、ハードバッチトリプレット損失のためのミニバッチを構成する。
  • ハードバッチトリプレット損失を用いて、クラス内距離を最小化し、クラス間距離を最大化することで、特徴の識別性を向上させる。
  • 各イテレーションの開始時に偽ラベルを再初期化することで、誤った割り当てを是正し、時間経過とともにラベル品質を向上させる。
  • クラスタリング、サンプリング、学習のプロセスを収束するまで繰り返し、過学習を避けるために早期停止を適用する。

実験結果

リサーチクエスチョン

  • RQ1階層的クラスタリングは、完全に教師なしの人物再識別に適した高品質な偽ラベルを効果的に生成できるか?
  • RQ2ノイズの多い偽ラベルを用いた学習において、ハードバッチトリプレット損失はモデルの一般化性能をどのように向上させるか?
  • RQ3性能を最大化するための最適なバランスは、クラスタ統合速度(マージパcent)とクラスタ数(s)の間でどのように得られるか?
  • RQ4偽ラベルの繰り返し再初期化は、誤差伝搬を低減させ、収束性を向上させることができるか?
  • RQ5階層的クラスタリングとハードバッチトリプレット損失の組み合わせは、既存の教師なし手法や教師ありドメイン適応手法を上回る性能を発揮するか?

主な発見

  • HCTはMarket-1501で56.4% mAP、DukeMTMC-reIDで50.7% mAPを達成し、最先端の完全に教師なし再識別手法を著しく上回った。
  • ラベル付きソースデータを必要とする多くの教師ありドメイン適応手法をも凌駕した。これは、ターゲットドメインのみでの自己教師学習の有効性を示している。
  • Market-1501ではs=13に設定した場合に最も良い性能が得られ、ラベル品質と収束安定性のバランスが取れていた。
  • マージパーセンテージ(mp)を0.07に設定した場合に最適な結果が得られ、中程度の統合速度がクラスタ品質を保つのに適していることが示された。
  • t-SNE可視化により、HCTは誤って異なるアイデンティティが統合された偽陽性と、正しく一致すべきアイデンティティが複数のクラスタに分離される偽陰性の両方を低減していることが確認された。
  • 階層的クラスタリングとハードバッチトリプレット損失の組み合わせにより、よりコンパクトで識別性の高い特徴表現が得られ、クラスタリング品質とmAPの両方が向上した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。