[論文レビュー] Key Points Estimation and Point Instance Segmentation Approach for Lane Detection
PINetは正確な車線のキーポイントを予測し、埋め込み特徴を用いて点を車線インスタンスにクラスタリングする。これにより、クリップ対応の深度とリアルタイム性能を備えた、順序非依存な車線検出が可能になる。
Perception techniques for autonomous driving should be adaptive to various environments. In the case of traffic line detection, an essential perception module, many condition should be considered, such as number of traffic lines and computing power of the target system. To address these problems, in this paper, we propose a traffic line detection method called Point Instance Network (PINet); the method is based on the key points estimation and instance segmentation approach. The PINet includes several stacked hourglass networks that are trained simultaneously. Therefore the size of the trained models can be chosen according to the computing power of the target environment. We cast a clustering problem of the predicted key points as an instance segmentation problem; the PINet can be trained regardless of the number of the traffic lines. The PINet achieves competitive accuracy and false positive on the TuSimple and Culane datasets, popular public datasets for lane detection. Our code is available at https://github.com/koyeongmin/PINet_new
研究の動機と目的
- traffic lines on」、
提案手法
- スタックド・アワーグラスネットワーク(PINet)を使用してキーポイントを予測し、それらを車線インスタンスセグメンテーションのために埋め込みます。
- アワーグラスブロックごとに3つの出力ブランチ:信頼度(点の存在)、オフセット(正確な点位置)、埋め込み特徴(インスタンスへクラスタリングするための)です。
- 64x32グリッドで出力を予測し、ディスティレーションを深い(教師)からクリップ済み(生徒)ネットワークへ適用して性能を保ちます。
- 存在性、非存在、オフセット、埋め込み特徴、ディスティレーション損失を組み合わせた多項損失で訓練します。総損失は加重和です。
- 再訓練なしでモデルサイズと計算要件を調整するために hourglass モジュールをクリップ可能です。
実験結果
リサーチクエスチョン
- RQ1PINetは、車線の数が異なるさまざまな道路シーンで正確なキーポイントを安定して予測できるか?
- RQ2埋め込みベースのインスタンス推論は偽陽性を減らし、事前に車線数を定義せずに車線インスタンスを正しく分離できるか?
- RQ3ネットワークを少ない hourglass モジュールにクリップした場合、知識蒸留は性能にどのように影響するか?
- RQ4標準的な車線検出ベンチマークにおけるネットワークの深さ(1H–4H)と精度/FP/FNの間にはどんなトレードオフがあるか?
主な発見
| 手法 | Acc | FP | FN |
|---|---|---|---|
| PINet(1H) | 95.81% | 0.0585 | 0.0330 |
| PINet(2H) | 96.51% | 0.0467 | 0.0254 |
| PINet(3H) | 96.72% | 0.0365 | 0.0243 |
| PINet(4H) | 96.75% | 0.0310 | 0.0250 |
| SCNN [20] | 96.53% | 0.0617 | 0.0180 |
| LaneNet(+H-net) [41] | 96.38% | 0.0780 | 0.0244 |
| Line-CNN [24] | 96.82% | 0.0442 | 0.0197 |
| ENet-SAD [30] | 96.64% | 0.0602 | 0.0205 |
| ERFNet-E2E [50] | 96.02% | 0.0321 | 0.0428 |
| PointLaneNet(MobileNet) [23] | 96.34% | 0.0467 | 0.0518 |
- PINetはTuSimpleおよびCULaneデータセットで競争力のある精度と低い偽陽性を達成する。
- より深いPINet(最大4H)は、3Hを超えるクリッピングでの利得が縮小する中で、精度を向上させる。
- クリップされたネットワーク(2H–4H)は、蒸留を用いると特に全4Hモデルに近い性能を示す。
- PINetは照明条件が難しい夜間・陰影・眩しい光の下でCULaneで特に強力な性能を示す。
- フレームワークは密集したセグメンテーション出力ではなくキーポイントを予測することで出力サイズを削減する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。