Skip to main content
QUICK REVIEW

[論文レビュー] FastReID: A Pytorch Toolbox for General Instance Re-identification

Lingxiao He, Xingyu Liao|arXiv (Cornell University)|Jun 4, 2020
Video Surveillance and Tracking Methods参考文献 44被引用数 123
ひとこと要約

FastReIDは、一般的なインスタンス再識別のためのモジュラーなPyTorchツールボックスを提供し、スケーラブルなトレーニング、豊富な評価指標、デプロイメントツールを備え、標準的なReIDベンチマークで高い結果を達成します。

ABSTRACT

General Instance Re-identification is a very important task in the computer vision, which can be widely used in many practical applications, such as person/vehicle re-identification, face recognition, wildlife protection, commodity tracing, and snapshop, etc.. To meet the increasing application demand for general instance re-identification, we present FastReID as a widely used software system in JD AI Research. In FastReID, highly modular and extensible design makes it easy for the researcher to achieve new research ideas. Friendly manageable system configuration and engineering deployment functions allow practitioners to quickly deploy models into productions. We have implemented some state-of-the-art projects, including person re-id, partial re-id, cross-domain re-id and vehicle re-id, and plan to release these pre-trained models on multiple benchmark datasets. FastReID is by far the most general and high-performance toolbox that supports single and multiple GPU servers, you can reproduce our project results very easily and are very welcome to use it, the code and models are available at https://github.com/JDAI-CV/fast-reid.

研究の動機と目的

  • 研究と実用の橋渡しを図る、一般的なインスタンス再識別のための統一された拡張可能なライブラリを動機付ける。
  • 新しいアイデアをコードを書き直さずに加速するためのモジュール型コンポーネント(バックボーン、アグリゲーション、ヘッド、ロス)を提供する。
  • 包括的な評価とデプロイメントサポートを提供する(マルチGPUトレーニング、蒸留、モデル変換)。
  • さまざまなReIDタスク(人物、クロスドメイン、部分、車両)に対する最先端の事前学習モデルを提供する。
  • 共通ベンチマーク上でのアプローチ間の公正で再現可能な比較を可能にする。

提案手法

  • 画像前処理、バックボーン、アグリゲーション、ヘッドの4モジュールからなるパイプラインを提案する。
  • 注意機構とIBN変種を備えた複数のバックボーン(ResNet、ResNeXt、ResNeSt)を実装する。
  • 4つのアグリゲーション手法(最大、平均、GeM、アテンションプーリング)と3つのヘッドタイプ(BNネック、線形、リダクション)を、バッチ正規化とともにサポートする。
  • ラベルスムージングを伴うクロスエントロピー、ArcFace、Circle loss、トリプレット損失など多様な損失関数と、学習率ウォームアップ、バックボーンフリーズ、コサイン学習率減衰といったトレーニングのコツを採用する。
  • 教師-生徒、ロジット整合などの知識蒸留を用いて、軽量で高精度なモデルを得る。
  • K-リシプロカル再ランキング、クエリ拡張といったポストプロセス手法と、ユークリッド距離、コサイン距離、DSRといった複数の距離指標を導入する。
  • PyTorchからCaffe/TensorRTへのモデル変換ツールと、実運用へデプロイするためのフレームワークを提供する。

実験結果

リサーチクエスチョン

  • RQ1モジュラーなPyTorchツールボックスは、一般的なインスタンス再識別モデルの迅速な開発とデプロイを支援できるか?
  • RQ2バックボーン、プーリング、損失関数のどの組み合わせが、複数のReIDタスク(人物、クロスドメイン、部分、車両)で高い性能を発揮するか?
  • RQ3トレーニング戦略と蒸留をどのように組み合わせれば、軽量なデプロイを可能にしつつ精度を向上できるか?
  • RQ4評価およびポストプロセスツールは、ReIDモデルの実世界デプロイ性能を最もよく反映するのか?

主な発見

手法Market1501 R1Market1501 mAPDukeMTMC R1DukeMTMC mAPMSMT17 R1MSMT17 mAP
FastReID (ResNet101-ibn)96.390.392.483.285.163.3
+ QE96.594.493.490.187.976.9
  • FastReIDは、Market-1501、DukeMTMC、MSMT17といった主要なReIDベンチマークで高い性能を達成し、ResNet101-IBNバックボーンがデータセット全体で高いrank-1/mAPを示す。
  • QE(クエリ拡張)と知識蒸留の組み込みは精度を向上させ、報告されたアブレーションでより高いmAPとrank-1を達成(例:+QEおよび蒸留の利得)。
  • このライブラリはCMCを超える豊富な評価指標(ROC、mINPを含む)を提供し、検索精度向上のための詳細なポストプロセスをサポートする。
  • FastReIDは複数のタスク(人物、クロスドメイン、部分、車両)向けの最先端の事前学習モデルを提供し、CaffeやTensorRTへのモデル変換によるデプロイを容易にする。
  • このフレームワークはタスクとドメイン間での強い転移を示し、実運用環境での実用的なデプロイを可能にする。
  • table_headers: ['Methods','Market1501 R1','Market1501 mAP','DukeMTMC R1','DukeMTMC mAP','MSMT17 R1','MSMT17 mAP'] ,
  • table_rows
  • [["FastReID (ResNet101-ibn)","96.3","90.3","92.4","83.2","85.1","63.3"],["+ QE (FastReID 101-ibn)","96.5","94.4","93.4","90.1","87.9","76.9"]]

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。