[논문 리뷰] OKVIS2: Realtime Scalable Visual-Inertial SLAM with Loop Closure
OKVIS2는 마진화된 관측으로 포즈 그래프 엣지를 구축하고 루프 클로저 후 랜드마크를 되살려 더 큰 최적화 윈도우를 가능하게 하는 루프 클로저를 갖춘 실시간 확장형 VI-SLAM 시스템을 제시한다.
Robust and accurate state estimation remains a challenge in robotics, Augmented, and Virtual Reality (AR/VR), even as Visual-Inertial Simultaneous Localisation and Mapping (VI-SLAM) getting commoditised. Here, a full VI-SLAM system is introduced that particularly addresses challenges around long as well as repeated loop-closures. A series of experiments reveals that it achieves and in part outperforms what state-of-the-art open-source systems achieve. At the core of the algorithm sits the creation of pose-graph edges through marginalisation of common observations, which can fluidly be turned back into landmarks and observations upon loop-closure. The scheme contains a realtime estimator optimising a bounded-size factor graph consisting of observations, IMU pre-integral error terms, and pose-graph edges -- and it allows for optimisation of larger loops re-using the same factor-graph asynchronously when needed.
연구 동기 및 목표
- 길고 반복적인 루프 클로저 시나리오에서 VI-SLAM의 강건성과 확장성을 다룬다.
- 제한된 크기의 팩터 그래프를 통해 정확도를 유지하면서 실시간 작동을 가능하게 한다.
- 오래된 랜드마크와 관측치를 부활시킬 수 있는 비동기 루프 클로저 최적화를 허용한다.
- 동적 장면에서 강건성을 높이기 위해 가벼운 다이나믹 오브젝트 분할을 도입한다.
제안 방법
- 마진화된 관측으로부터 포즈-그래프 인자를 구성하여 최적화 윈도우를 확장한다.
- 관측, IMU 프리-인테그레이티드 항들, 및 포즈-그래프 엣지를 포함하는 제한된 크기의 팩터 그래프를 가진 실시간 추정기를 유지한다.
- 비동기적으로 루프-클로저 최적화를 수행하고 포즈-그래프 엣지를 다시 관측/랜드마크로 변환한다.
- 휴대성을 위한 CPU에서 실행되는 경량 분할 CNN을 사용해 키프레임의 동적 관측치를 제거한다.
- 장기 제약 조건을 보존하면서 그래프 크기를 관리하기 위해 공동 가시성(코-보이어런스) 휴리스틱으로 새로운 키프레임을 선택한다.
- 시각, 관성, 포즈-그래프 항의 비선형 최소제곱 최적화를 위해 Ceres Solver를 사용한다.
실험 결과
연구 질문
- RQ1길거나 잦은 루프 클로저가 존재하는 상황에서 VI-SLAM은 어떻게 강건성과 정확성을 유지할 수 있는가?
- RQ2실시간 추정기가 오래된 관측치를 포즈-그래프 인자를 통해 활용하면서도 한정된 크기의 그래프에서 작동할 수 있는가?
- RQ3관측치를 마진화하는 것이 루프 클로저 품질과 랜드마크의 재활성화에 어떤 영향을 미치는가?
- RQ4CPU 기반의 경량 다이나믹 영역 분할이 VI-SLAM의 강건성을 실시간 성능 손실 없이 향상시키는가?
- RQ5루프 클로저가 활성화될 때 표준 데이터셋에서 OKVIS2가 최신 VI-SLAM/VIO 시스템과 어떻게 비교되는가?
주요 결과
| 행 | VIO | VI-SLAM | OKVIS2 VIO | OKVIS2 slam-final | VINS-Fusion | OKVIS2 causal | ORB-SLAM3 | OKVIS2 (ours) |
|---|---|---|---|---|---|---|---|---|
| MH_01 | 0.080 | 0.119 | 0.089 | 0.071 | 0.138 | 0.048 | 0.035 | 0.031 |
| MH_02 | 0.060 | 0.119 | 0.044 | 0.044 | 0.152 | 0.036 | 0.033 | 0.023 |
| MH_03 | 0.050 | 0.119 | 0.096 | 0.082 | 0.125 | 0.050 | 0.035 | 0.028 |
| MH_04 | 0.100 | 0.119 | 0.197 | 0.189 | 0.280 | 0.089 | 0.051 | 0.066 |
| MH_05 | 0.080 | 0.119 | 0.206 | 0.141 | 0.284 | 0.112 | 0.082 | 0.068 |
| V1_01 | 0.040 | 0.119 | 0.050 | 0.043 | 0.076 | 0.037 | 0.038 | 0.035 |
| V1_02 | 0.020 | 0.119 | 0.066 | 0.037 | 0.069 | 0.021 | 0.014 | 0.013 |
| V1_03 | 0.030 | 0.119 | 0.071 | 0.036 | 0.114 | 0.035 | 0.024 | 0.019 |
| V2_01 | 0.030 | 0.119 | 0.062 | 0.044 | 0.066 | 0.036 | 0.032 | 0.023 |
| V2_02 | 0.020 | 0.119 | 0.077 | 0.044 | 0.091 | 0.024 | 0.014 | 0.015 |
| V2_03 | - | 0.119 | 0.028 | 0.063 | 0.096 | 0.045 | 0.024 | 0.020 |
| Avg | - | 0.119 | 0.089 | 0.071 | 0.138 | 0.048 | 0.035 | 0.031 |
- OKVIS2는 EuRoC 및 TUM VI 벤치마크에서 최신 기법과 비교해 동급 또는 우수한 정확도를 달성한다.
- EuRoC에서 OKVIS2는 ORB-SLAM3 및 다른 기준과 비교해 정확한 궤적 오차(ATE)가 동등하거나 약간 더 우수한 것을 보이며(인과적 대 비인과적 평가 주석).
- 루프 클로저 최적화 후 오래된 랜드마크를 되살리고 관측치를 재통합함으로써 강력한 루프 클로저 성능을 보여준다.
- 감지된 루프를 둘러싼 비동기 최적화된 전체 그래프를 가진 제한된 크기의 실시간 추정기가 장기 제약 조건을 활용하면서 실시간 작동을 유지한다.
- 경량 CPU 기반 분할 CNN이 동적 영역 관측을 줄여 구름/인물이 있는 장면에서 정확도를 향상시킨다.
- OKVIS2는 여러 데이터셋에 걸친 상세한 비교 결과를 제공하며 루프가 효과적으로 처리될 때의 확장성과 장기적 드리프트에 대한 강건성을 강조한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.