QUICK REVIEW

[論文レビュー] CVPR19 Tracking and Detection Challenge: How crowded can it get?

Patrick Dendorfer, Hamid Rezatofighi|arXiv (Cornell University)|Jun 10, 2019

Video Surveillance and Tracking Methods参考文献 16被引用数 68

ひとこと要約

この論文は、CVPR19 MOTChallengeベンチマークを8つの高度に混雑したシーケンスとともに紹介し、極めて密集したシーンでマルチオブジェクト追跡と検出をテストする。データ、注釈、検出、そして標準化された評価プロトコルを提供します。

ABSTRACT

Standardized benchmarks are crucial for the majority of computer vision applications. Although leaderboards and ranking tables should not be over-claimed, benchmarks often provide the most objective measure of performance and are therefore important guides for research. The benchmark for Multiple Object Tracking, MOTChallenge, was launched with the goal to establish a standardized evaluation of multiple object tracking methods. The challenge focuses on multiple people tracking, since pedestrians are well studied in the tracking community, and precise tracking and detection has high practical relevance. Since the first release, MOT15, MOT16 and MOT17 have tremendously contributed to the community by introducing a clean dataset and precise framework to benchmark multi-object trackers. In this paper, we present our CVPR19 benchmark, consisting of 8 new sequences depicting very crowded challenging scenes. The benchmark will be presented at the 4th BMTT MOT Challenge Workshop at the Computer Vision and Pattern Recognition Conference (CVPR) 2019, and will evaluate the state-of-the-art in multiple object tracking whend handling extremely crowded scenarios.

研究の動機と目的

トラッカーと検出器をストレステストするため、極めて混雑したシーンでMOTChallengeを拡張する。
注意深く注釈付けされたデータ、公開検出、および統一された評価フレームワークを提供する。
制約のない環境における追跡手法の頑健性と一般化を評価する。

提案手法

室内/室外、日/夜のバリエーションを含む3つのシーンにわたる8つのCVPR19シーケンスを提示する。
一貫性を確保するため、MOT16プロトコルに従って動く歩行者および関連クラスを注釈付けする。
追跡のベースラインとして、CVPR19トレーニングデータで訓練された公開済みのFaster R-CNN検出を提供する。
CLEAR指標およびWu & Nevatiaの追跡品質指標を用いた評価を定義し、時系列割り当てはHungarianアルゴリズムを用いる。
最終的な追跡評価から非対象クラス（例：静的な人物、車両など）を除外し、歩行者に焦点を当てる。
検出とグラウンドトゥルーのデータ形式仕様（CSV）を、フレームレベルのIDと境界ボックスとともに提供する。

実験結果

リサーチクエスチョン

RQ1最先端のトラッカーは、フレームあたり最大246人の歩行者がいる極めて混雑したシーンでどのように性能を発揮するか？
RQ2CVPR19データで訓練された検出器は、CVPR19テストセット内の未知のシーンに一般化するか？
RQ3遮蔽、妨害要因、および高密度シナリオに対して追跡手法はどれくらい頑健か？
RQ4公開検出と非公開検出を用いることがトラッカー評価に与える影響は何か？

主な発見

CVPR19ベンチマークは、フレームあたり最大246人の歩行者密度を持つ8つの新規シーケンスを含みます。
訓練データとテストデータは、それぞれ 2,390 と 1,492 の注釈付き軌跡を含み、合計で 2.25 million の注釈を超える。
公開された Faster R-CNN 検出は、トレーニング/テストのトラッカーの基準として提供される（総検出数: 981,031）。
評価は CLEAR 指標（MOTA, MOTP）および追跡品質指標（MT/PT/ML、FM）を用いて、シーケンス全体でトラッカーの性能を評価する。
データセットは、室内/室外および日/夜の条件を含む3つのシーンからのシーケンスと、一般化を評価するための既知テストシーンと未知テストシーンを含む。
検出は歩行者に焦点を当て、静的な人物や他のクラスは最終的な性能には含めず、遮蔽解析のために注釈される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。