[論文レビュー] OKVIS2: Realtime Scalable Visual-Inertial SLAM with Loop Closure
OKVIS2は、周辺化された観測からポーズグラフエッジを構築し、ループクロージャ後にランドマークを復活させるリアルタイムにスケーラブルな VI-SLAM システムを提示し、より大きな最適化ウィンドウを可能にします。
Robust and accurate state estimation remains a challenge in robotics, Augmented, and Virtual Reality (AR/VR), even as Visual-Inertial Simultaneous Localisation and Mapping (VI-SLAM) getting commoditised. Here, a full VI-SLAM system is introduced that particularly addresses challenges around long as well as repeated loop-closures. A series of experiments reveals that it achieves and in part outperforms what state-of-the-art open-source systems achieve. At the core of the algorithm sits the creation of pose-graph edges through marginalisation of common observations, which can fluidly be turned back into landmarks and observations upon loop-closure. The scheme contains a realtime estimator optimising a bounded-size factor graph consisting of observations, IMU pre-integral error terms, and pose-graph edges -- and it allows for optimisation of larger loops re-using the same factor-graph asynchronously when needed.
研究の動機と目的
- VI-SLAMの長期かつ反復的なループクロージャシナリオにおける堅牢性とスケーラビリティの確保。
- 境界サイズのファクタグラフによって精度を維持しつつリアルタイム動作を実現。
- 旧ランドマークや観測を再活性化できる非同期のループクロージョ optimisationを許容。
- 動的シーンでの堅牢性を高める軽量な動的物体セグメンテーションの組み込み。
提案手法
- 周辺化された観測からポーズグラフ因子を構築して最適化ウィンドウを拡大。
- 観測、IMU事前積分項、およびポーズグラフエッジを含む境界サイズのファクタグラフを用いたリアルタイム推定器を維持。
- 検出されたループ周辺で非同期にループクロージョン最適化を実行し、ポーズグラフエッジを再度観測/ランドマークへ変換。
- CPU上で実行される軽量なセグメンテーションCNNをキーフレームに適用して動的観測を除去、移植性を確保。
- 共視アルゴリズムを用いて新しいキーフレームを選択し、グラフサイズを管理しつつ長期的な制約を維持。
- ビジュアル・慣性・ポーズグラフ項の非線形最小二乗法最適化にCERESソルバーを使用。
実験結果
リサーチクエスチョン
- RQ1長期または頻繁なループクロージャがある状況で、VI-SLAMはどのように堅牢性と精度を維持できるか。
- RQ2境界サイズのグラフで動作するリアルタイム推定器が、古い観測からの情報をポーズグラフ因子で活用しつつ動作できるか。
- RQ3観測を周辺化することがループクロージョンの品質とランドマークの再活性化にどのような影響を与えるか。
- RQ4CPUベースの軽量な動的領域セグメンテーションは、リアルタイム性能を犠牲にすることなくVI-SLAMの堅牢性を向上させるか。
- RQ5ループがうまく処理されたとき、OKVIS2は標準データセット上の最先端のVI-SLAM/VIOシステムとどう比較されるか。
主な発見
| 行 | VIO | VI-SLAM | OKVIS2 VIO | OKVIS2 slam-final | VINS-Fusion | OKVIS2 causal | ORB-SLAM3 | OKVIS2 (ours) |
|---|---|---|---|---|---|---|---|---|
| MH_01 | 0.080 | 0.119 | 0.089 | 0.071 | 0.138 | 0.048 | 0.035 | 0.031 |
| MH_02 | 0.060 | 0.119 | 0.044 | 0.044 | 0.152 | 0.036 | 0.033 | 0.023 |
| MH_03 | 0.050 | 0.119 | 0.096 | 0.082 | 0.125 | 0.050 | 0.035 | 0.028 |
| MH_04 | 0.100 | 0.119 | 0.197 | 0.189 | 0.280 | 0.089 | 0.051 | 0.066 |
| MH_05 | 0.080 | 0.119 | 0.206 | 0.141 | 0.284 | 0.112 | 0.082 | 0.068 |
| V1_01 | 0.040 | 0.119 | 0.050 | 0.043 | 0.076 | 0.037 | 0.038 | 0.035 |
| V1_02 | 0.020 | 0.119 | 0.066 | 0.037 | 0.069 | 0.021 | 0.014 | 0.013 |
| V1_03 | 0.030 | 0.119 | 0.071 | 0.036 | 0.114 | 0.035 | 0.024 | 0.019 |
| V2_01 | 0.030 | 0.119 | 0.062 | 0.044 | 0.066 | 0.036 | 0.032 | 0.023 |
| V2_02 | 0.020 | 0.119 | 0.077 | 0.044 | 0.091 | 0.024 | 0.014 | 0.015 |
| V2_03 | - | 0.119 | 0.028 | 0.063 | 0.096 | 0.045 | 0.024 | 0.020 |
| Avg | - | 0.119 | 0.089 | 0.071 | 0.138 | 0.048 | 0.035 | 0.031 |
- OKVIS2はEuRoCとTUM VIのベンチマークで、最先端アプローチと比較して競争力のある、またはそれを上回る精度を達成。
- EuRoCでは、OKVIS2はORB-SLAM3や他のベースラインと比較してAbsolute Trajectory Error (ATE) が同等またはやや優れている(因果的評価と非因果的評価の注記あり)。
- システムは、ループクロージョン後に古いランドマークを復活させ、観測を再統合することで強力なループクロージョン性能を示す。
- 検出されたループ周りの全グラフを非同期に最適化する境界サイズのリアルタイム推定機は、長期的な制約を活用しつつリアルタイム動作を維持。
- CPUベースの軽量セグメンテーションCNNは動的領域の観測を減らし、雲や人がいるシーンでの精度を改善。
- OKVIS2は複数データセットにわたる詳細な比較結果を提供し、ループを効果的に処理した際の長期的ドリフトに対するスケーラビリティと堅牢性を強調。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。