Skip to main content
QUICK REVIEW

[論文レビュー] A Baseline for 3D Multi-Object Tracking

Xinshuo Weng, Kris Kitani|arXiv (Cornell University)|Jul 9, 2019
Advanced Neural Network Applications参考文献 32被引用数 81
ひとこと要約

この論文は、市販の3D物体検出器と3Dカルマンフィルタ、ハンガリアンアルゴリズムを組み合わせることで、シンプルだが非常に効率的なリアルタイム3次元マルチオブジェクトトラッキング(MOT)ベースラインシステムを提案する。単純であるにもかかわらず、KITTI 3D MOTベンチマークで最先端の性能を達成し、3D MOTAを76.47まで向上させ、214.7 FPSで動作する——これは前例となるSOTA 2D MOTシステムの65倍速い。

ABSTRACT

3D multi-object tracking (MOT) is an essential component technology for many real-time applications such as autonomous driving or assistive robotics. However, recent works for 3D MOT tend to focus more on developing accurate systems giving less regard to computational cost and system complexity. In contrast, this work proposes a simple yet accurate real-time baseline 3D MOT system. We use an off-the-shelf 3D object detector to obtain oriented 3D bounding boxes from the LiDAR point cloud. Then, a combination of 3D Kalman filter and Hungarian algorithm is used for state estimation and data association. Although our baseline system is a straightforward combination of standard methods, we obtain the state-of-the-art results. To evaluate our baseline system, we propose a new 3D MOT extension to the official KITTI 2D MOT evaluation along with two new metrics. Our proposed baseline method for 3D MOT establishes new state-of-the-art performance on 3D MOT for KITTI, improving the 3D MOTA from 72.23 of prior art to 76.47. Surprisingly, by projecting our 3D tracking results to the 2D image plane and compare against published 2D MOT methods, our system places 2nd on the official KITTI leaderboard. Also, our proposed 3D MOT method runs at a rate of 214.7 FPS, 65 times faster than the state-of-the-art 2D MOT system. Our code is publicly available at this https URL

研究の動機と目的

  • 計算効率的で正確な3D MOTシステムを開発し、性能と速度のバランスをとること。
  • 自動運転およびロボット分野における3次元マルチオブジェクトトラッキングの実用的でリアルタイムなベースラインを確立すること。
  • 新しい指標を含む拡張されたKITTI 2D MOTベンチマークを用いて3D MOTのパフォーマンスを評価すること。
  • 標準的なコンponentsの単純な組み合わせが、複雑で特化したシステムを上回ることを示すこと。

提案手法

  • LiDAR点群からオriented 3次元バウンディングボックスを生成するために市販の3D物体検出器を用いる。
  • 追跡対象オブジェクトの状態推定に3次元カルマンフィルタを採用する。
  • 検出結果と既存のトラック間のデータ関連付けにハンガリアンアルゴリズムを適用する。
  • 2D画像平面への3次元トラッキング結果の投影により、2D MOT手法とのベンチマーク比較を実施する。
  • 公式KITTI 2D MOTベンチマークを拡張した、新しい3次元MOT評価プロトコルを導入する。
  • 標準的なMOTAを超えた3次元MOTパフォーマンスを評価するための2つの新しい指標を実装する。

実験結果

リサーチクエスチョン

  • RQ1標準的な3次元検出とトラッキングコンponentsの単純でモジュラーな組み合わせが、最先端の3次元MOTパフォーマンスを達成できるか?
  • RQ22次元に投影した場合、リアルタイム3次元MOTシステムの性能はSOTA 2D MOTシステムと比べてどうか?
  • RQ3複雑なSOTAシステムと比較して、軽量な3次元MOTベースラインの計算効率はどの程度か?
  • RQ4単純な3次元トラッカーが、精度と速度の両面で特化したシステムをどの程度上回れるか?
  • RQ5提案された3次元MOT評価プロトコルは、3次元トラッキングパフォーマンスの評価をどの程度改善するか?

主な発見

  • 提案された3次元MOTベースラインは、KITTIデータセットで3D MOTA 76.47を達成し、前例のSOTA(72.23)を上回った。
  • 2次元に投影した場合、このシステムは公式KITTI 2D MOTランクイングで2位となった。
  • システムは214.7 FPSで動作し、SOTA 2D MOTシステムの65倍速い。
  • この手法は、3次元MOTにおいて単純さと効率性が正確性を損なわないことを示した。
  • 新しい評価プロトコルと指標により、3次元MOTシステムの包括的で公平なベンチマーク評価が可能になった。
  • 結果から、適切に統合された場合、カルマンフィルタやハンガリアンアルゴリズムといった標準コンponentsが、現代の3次元トラッキングにおいても極めて有効であることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。