QUICK REVIEW

[논문 리뷰] OKVIS2: Realtime Scalable Visual-Inertial SLAM with Loop Closure

Stefan Leutenegger|arXiv (Cornell University)|2022. 02. 18.

Robotics and Sensor-Based Localization인용 수 24

한 줄 요약

OKVIS2는 마진화된 관측으로 포즈 그래프 엣지를 구축하고 루프 클로저 후 랜드마크를 되살려 더 큰 최적화 윈도우를 가능하게 하는 루프 클로저를 갖춘 실시간 확장형 VI-SLAM 시스템을 제시한다.

ABSTRACT

Robust and accurate state estimation remains a challenge in robotics, Augmented, and Virtual Reality (AR/VR), even as Visual-Inertial Simultaneous Localisation and Mapping (VI-SLAM) getting commoditised. Here, a full VI-SLAM system is introduced that particularly addresses challenges around long as well as repeated loop-closures. A series of experiments reveals that it achieves and in part outperforms what state-of-the-art open-source systems achieve. At the core of the algorithm sits the creation of pose-graph edges through marginalisation of common observations, which can fluidly be turned back into landmarks and observations upon loop-closure. The scheme contains a realtime estimator optimising a bounded-size factor graph consisting of observations, IMU pre-integral error terms, and pose-graph edges -- and it allows for optimisation of larger loops re-using the same factor-graph asynchronously when needed.

연구 동기 및 목표

길고 반복적인 루프 클로저 시나리오에서 VI-SLAM의 강건성과 확장성을 다룬다.
제한된 크기의 팩터 그래프를 통해 정확도를 유지하면서 실시간 작동을 가능하게 한다.
오래된 랜드마크와 관측치를 부활시킬 수 있는 비동기 루프 클로저 최적화를 허용한다.
동적 장면에서 강건성을 높이기 위해 가벼운 다이나믹 오브젝트 분할을 도입한다.

제안 방법

마진화된 관측으로부터 포즈-그래프 인자를 구성하여 최적화 윈도우를 확장한다.
관측, IMU 프리-인테그레이티드 항들, 및 포즈-그래프 엣지를 포함하는 제한된 크기의 팩터 그래프를 가진 실시간 추정기를 유지한다.
비동기적으로 루프-클로저 최적화를 수행하고 포즈-그래프 엣지를 다시 관측/랜드마크로 변환한다.
휴대성을 위한 CPU에서 실행되는 경량 분할 CNN을 사용해 키프레임의 동적 관측치를 제거한다.
장기 제약 조건을 보존하면서 그래프 크기를 관리하기 위해 공동 가시성(코-보이어런스) 휴리스틱으로 새로운 키프레임을 선택한다.
시각, 관성, 포즈-그래프 항의 비선형 최소제곱 최적화를 위해 Ceres Solver를 사용한다.

실험 결과

연구 질문

RQ1길거나 잦은 루프 클로저가 존재하는 상황에서 VI-SLAM은 어떻게 강건성과 정확성을 유지할 수 있는가?
RQ2실시간 추정기가 오래된 관측치를 포즈-그래프 인자를 통해 활용하면서도 한정된 크기의 그래프에서 작동할 수 있는가?
RQ3관측치를 마진화하는 것이 루프 클로저 품질과 랜드마크의 재활성화에 어떤 영향을 미치는가?
RQ4CPU 기반의 경량 다이나믹 영역 분할이 VI-SLAM의 강건성을 실시간 성능 손실 없이 향상시키는가?
RQ5루프 클로저가 활성화될 때 표준 데이터셋에서 OKVIS2가 최신 VI-SLAM/VIO 시스템과 어떻게 비교되는가?

주요 결과

행	VIO	VI-SLAM	OKVIS2 VIO	OKVIS2 slam-final	VINS-Fusion	OKVIS2 causal	ORB-SLAM3	OKVIS2 (ours)
MH_01	0.080	0.119	0.089	0.071	0.138	0.048	0.035	0.031
MH_02	0.060	0.119	0.044	0.044	0.152	0.036	0.033	0.023
MH_03	0.050	0.119	0.096	0.082	0.125	0.050	0.035	0.028
MH_04	0.100	0.119	0.197	0.189	0.280	0.089	0.051	0.066
MH_05	0.080	0.119	0.206	0.141	0.284	0.112	0.082	0.068
V1_01	0.040	0.119	0.050	0.043	0.076	0.037	0.038	0.035
V1_02	0.020	0.119	0.066	0.037	0.069	0.021	0.014	0.013
V1_03	0.030	0.119	0.071	0.036	0.114	0.035	0.024	0.019
V2_01	0.030	0.119	0.062	0.044	0.066	0.036	0.032	0.023
V2_02	0.020	0.119	0.077	0.044	0.091	0.024	0.014	0.015
V2_03	-	0.119	0.028	0.063	0.096	0.045	0.024	0.020
Avg	-	0.119	0.089	0.071	0.138	0.048	0.035	0.031

OKVIS2는 EuRoC 및 TUM VI 벤치마크에서 최신 기법과 비교해 동급 또는 우수한 정확도를 달성한다.
EuRoC에서 OKVIS2는 ORB-SLAM3 및 다른 기준과 비교해 정확한 궤적 오차(ATE)가 동등하거나 약간 더 우수한 것을 보이며(인과적 대 비인과적 평가 주석).
루프 클로저 최적화 후 오래된 랜드마크를 되살리고 관측치를 재통합함으로써 강력한 루프 클로저 성능을 보여준다.
감지된 루프를 둘러싼 비동기 최적화된 전체 그래프를 가진 제한된 크기의 실시간 추정기가 장기 제약 조건을 활용하면서 실시간 작동을 유지한다.
경량 CPU 기반 분할 CNN이 동적 영역 관측을 줄여 구름/인물이 있는 장면에서 정확도를 향상시킨다.
OKVIS2는 여러 데이터셋에 걸친 상세한 비교 결과를 제공하며 루프가 효과적으로 처리될 때의 확장성과 장기적 드리프트에 대한 강건성을 강조한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.