[论文解读] OKVIS2: Realtime Scalable Visual-Inertial SLAM with Loop Closure
OKVIS2 提供一个具备回环闭环的实时可扩展 VI-SLAM 系统,它从边缘化观测构建位姿图边并在回环闭合后重新激活地标,从而实现更大的优化窗口。
Robust and accurate state estimation remains a challenge in robotics, Augmented, and Virtual Reality (AR/VR), even as Visual-Inertial Simultaneous Localisation and Mapping (VI-SLAM) getting commoditised. Here, a full VI-SLAM system is introduced that particularly addresses challenges around long as well as repeated loop-closures. A series of experiments reveals that it achieves and in part outperforms what state-of-the-art open-source systems achieve. At the core of the algorithm sits the creation of pose-graph edges through marginalisation of common observations, which can fluidly be turned back into landmarks and observations upon loop-closure. The scheme contains a realtime estimator optimising a bounded-size factor graph consisting of observations, IMU pre-integral error terms, and pose-graph edges -- and it allows for optimisation of larger loops re-using the same factor-graph asynchronously when needed.
研究动机与目标
- 在长期和重复回环闭合场景下提升 VI-SLAM 的鲁棒性和可扩展性。
- 通过有界大小的因子图实现实时运行,同时保持精度。
- 允许异步回环闭合优化,能够重新激活旧地标和观测。
- 引入轻量级的动态对象分割,以提升在动态场景中的鲁棒性。
提出的方法
- 从边缘化观测构建位姿图因子,以扩大优化窗口。
- 维护一个含观测、IMU 预积分项以及位姿图边的有界大小因子图的实时估计器。
- 异步执行回环闭合优化,并将位姿图边重新转换为观测/地标。
- 在关键帧上使用轻量级分割 CNN,将动态观测移除,跑在 CPU 上以提高可移植性。
- 使用共视性启发式选择新的关键帧,以在保留长期约束的同时管理图的规模。
- 使用 Ceres Solver 对视觉、惯性和位姿图项进行非线性最小二乘优化。
实验结果
研究问题
- RQ1在存在长期或频繁回环闭合的情况下,VI-SLAM 如何保持鲁棒性和精度?
- RQ2实时估计器是否能够在有界大小的图上运行,同时通过位姿图因子利用较旧观测的信息?
- RQ3对观测边缘化对回环闭合质量和地标重新激活的影响是什么?
- RQ4基于 CPU 的轻量级动态区域分割是否在不牺牲实时性能的前提下提升 VI-SLAM 的鲁棒性?
- RQ5在启用回环闭合时,OKVIS2 与标准数据集上的先进 VI-SLAM/VIO 系统相比如何?
主要发现
| Row | VIO | VI-SLAM | OKVIS2 VIO | OKVIS2 slam-final | VINS-Fusion | OKVIS2 causal | ORB-SLAM3 | OKVIS2 (ours) |
|---|---|---|---|---|---|---|---|---|
| MH_01 | 0.080 | 0.119 | 0.089 | 0.071 | 0.138 | 0.048 | 0.035 | 0.031 |
| MH_02 | 0.060 | 0.119 | 0.044 | 0.044 | 0.152 | 0.036 | 0.033 | 0.023 |
| MH_03 | 0.050 | 0.119 | 0.096 | 0.082 | 0.125 | 0.050 | 0.035 | 0.028 |
| MH_04 | 0.100 | 0.119 | 0.197 | 0.189 | 0.280 | 0.089 | 0.051 | 0.066 |
| MH_05 | 0.080 | 0.119 | 0.206 | 0.141 | 0.284 | 0.112 | 0.082 | 0.068 |
| V1_01 | 0.040 | 0.119 | 0.050 | 0.043 | 0.076 | 0.037 | 0.038 | 0.035 |
| V1_02 | 0.020 | 0.119 | 0.066 | 0.037 | 0.069 | 0.021 | 0.014 | 0.013 |
| V1_03 | 0.030 | 0.119 | 0.071 | 0.036 | 0.114 | 0.035 | 0.024 | 0.019 |
| V2_01 | 0.030 | 0.119 | 0.062 | 0.044 | 0.066 | 0.036 | 0.032 | 0.023 |
| V2_02 | 0.020 | 0.119 | 0.077 | 0.044 | 0.091 | 0.024 | 0.014 | 0.015 |
| V2_03 | - | 0.119 | 0.028 | 0.063 | 0.096 | 0.045 | 0.024 | 0.020 |
| Avg | - | 0.119 | 0.089 | 0.071 | 0.138 | 0.048 | 0.035 | 0.031 |
- OKVIS2 在 EuRoC 和 TUM VI 基准测试中达到或优于最先进方法的精度。
- 在 EuRoC 中,OKVIS2 的绝对轨迹误差(ATE)与 ORB-SLAM3 等基线相比相当甚至略优(注明有因果与非因果评估)。
- 该系统通过回环闭合优化后重新激活旧地标并重新集成观测,展示出强的回环闭合性能。
- 一个在检测到回环后对完整图进行异步优化的有界大小实时估计器,保持实时运行,同时利用长期约束。
- 一个轻量级的基于 CPU 的分割 CNN 减少动态区域观测,在有云/人等场景中提升精度。
- OKVIS2 在多个数据集上提供了详细的对比结果,突出其可扩展性以及在回环有效处理时对长期漂移的鲁棒性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。