QUICK REVIEW

[論文レビュー] Scalability in Perception for Autonomous Driving: An Open Dataset Benchmark

Pei Sun, Henrik Kretzschmar|arXiv (Cornell University)|Dec 10, 2019

Video Surveillance and Tracking Methods参考文献 16被引用数 21

ひとこと要約

本論文は、都市部および準都市部の環境をカバーする1,150の同期的・キャリブレーション済みLiDARおよびカメラシーンから構成される大規模で多様性に富み、高品質な自動運転データセットを紹介する。このデータセットは、既存のカメラ＋LiDARデータセットと比較して15倍以上多様性に富んでおり、一貫したトラッキングIDを有する包括的な2Dおよび3Dバウンディングボックスアノテーションを備えており、2D／3D検出およびトラッキングの強力なベースラインを提供する。また、データセットサイズおよびクロスジオグラフィック一般化効果の実証的分析も実施している。

ABSTRACT

The research community has increasing interest in autonomous driving research, despite the resource intensity of obtaining representative real world data. Existing self-driving datasets are limited in the scale and variation of the environments they capture, even though generalization within and between operating regions is crucial to the overall viability of the technology. In an effort to help align the research community's contributions with real-world self-driving problems, we introduce a new large scale, high quality, diverse dataset. Our new dataset consists of 1150 scenes that each span 20 seconds, consisting of well synchronized and calibrated high quality LiDAR and camera data captured across a range of urban and suburban geographies. It is 15x more diverse than the largest camera+LiDAR dataset available based on our proposed diversity metric. We exhaustively annotated this data with 2D (camera image) and 3D (LiDAR) bounding boxes, with consistent identifiers across frames. Finally, we provide strong baselines for 2D as well as 3D detection and tracking tasks. We further study the effects of dataset size and generalization across geographies on 3D detection methods. Find data, code and more up-to-date information at this http URL.

研究の動機と目的

自動運転認識研究における大規模で多様性に富み、適切にアノテートされたデータセットの不足に対処すること。
広範な環境的変動を備えたデータセットを提供することで、異なる都市部および準都市部の地理的環境におけるモデル一般化の向上を図ること。
一貫性があり高品質なアノテーションを通じて、2Dおよび3Dオブジェクト検出およびトラッキング手法の堅牢なベンチマークを支援すること。
データセットサイズおよびクロスジオグラフィック一般化の影響が3D検出性能に与える影響を実証的に調査すること。

提案手法

高解像度LiDARおよびキャリブレーション済みカメラを搭載した車両を用いて、多様な都市部および準都市部の環境でデータセットを収集した。
各シーンは、正確なキャリブレーションを伴う、時間的に同期されたLiDARおよびカメラデータを20秒間収集したものである。
すべてのオブジェクトに対して包括的な2Dおよび3Dバウンディングボックスアノテーションを実施し、トラッキングに一貫した識別子を割り当てた。
新しいデータセットが、最大の既存のカメラ＋LiDARデータセットと比較して15倍以上多様性に富んでいることを示す定量的多様性指標を新たに導入した。
新規データセットを用いて、2Dおよび3D検出およびマルチオブジェクトトラッキングの強力なベースラインを確立した。
アブレーションスタディを用いて、トレーニングデータサイズおよびクロスジオグラフィック一般化の影響が3D検出モデルに与える影響を評価した。

実験結果

リサーチクエスチョン

RQ1自動運転における3Dオブジェクト検出モデルの性能に、データセットサイズの増大がどのように影響するか？
RQ2複数の地域ではなく、1つの地域での学習に比べて、多様な地理的地域で学習することで、モデル一般化はどの程度向上するか？
RQ3定義された指標を用いて、提案されたデータセットの多様性は、既存の大規模データセットと定量的にどのように比較できるか？
RQ42Dおよび3D検出およびトラッキングタスクにおいて、新規データセットで強力なベースラインを用いることで、どの程度の性能向上が達成できるか？
RQ5クロスジオグラフィックなデータ分布は、3D検出モデルのロバストネスにどのように影響するか？

主な発見

導入された多様性指標に基づき、提案されたデータセットは、最大の既存のカメラ＋LiDARデータセットと比較して15倍以上多様性に富んでいる。
データセットには、1,150の高品質で同期的かつキャリブレーション済みのLiDARおよびカメラシーンが含まれており、各シーンは20秒間である。
すべてのシーンにわたり、一貫したトラッキングIDを有する包括的な2Dおよび3Dバウンディングボックスアノテーションが正常に作成された。
新規データセット上で2Dおよび3D検出およびマルチオブジェクトトラッキングタスクの強力なベースラインが確立された。
アブレーションスタディの結果、より大きなトレーニングデータセットおよびクロスジオグラフィックデータが、3D検出の一般化を向上させることを示した。
結果は、特にクロスジオグラフィックな状況において、データセットの多様性およびサイズの増大に伴い、モデル性能が顕著に向上することを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。