[论文解读] Real-time Monocular Visual Odometry for Turbid and Dynamic Underwater Environments
本文提出 UW-VO,一种用于水下环境的实时单目视觉里程计系统,能够对浑浊度和短时遮挡具有鲁棒性,使用通过光流跟踪的 Harris 角点,配备重追踪机制和窗口化束调整。
In the context of robotic underwater operations, the visual degradations induced by the medium properties make difficult the exclusive use of cameras for localization purpose. Hence, most localization methods are based on expensive navigational sensors associated with acoustic positioning. On the other hand, visual odometry and visual SLAM have been exhaustively studied for aerial or terrestrial applications, but state-of-the-art algorithms fail underwater. In this paper we tackle the problem of using a simple low-cost camera for underwater localization and propose a new monocular visual odometry method dedicated to the underwater environment. We evaluate different tracking methods and show that optical flow based tracking is more suited to underwater images than classical approaches based on descriptors. We also propose a keyframe-based visual odometry approach highly relying on nonlinear optimization. The proposed algorithm has been assessed on both simulated and real underwater datasets and outperforms state-of-the-art visual SLAM methods under many of the most challenging conditions. The main application of this work is the localization of Remotely Operated Vehicles (ROVs) used for underwater archaeological missions but the developed system can be used in any other applications as long as visual information is available.
研究动机与目标
- 以单目相机为基础,推动用于轻量级水下无人潜水器(ROV)的亚米级定位。
- 开发对浑浊、纹理稀少以及来自海洋生物的动态遮挡具有鲁棒性的 VO 框架。
- 评估特征跟踪方法,以选择最鲁棒的水下 VO 方案。
- 在水下数据集上将 UW-VO 与最先进的单目 VO / V-SLAM 方法进行比较。
提出的方法
- 在每个关键帧上检测 Shi-Tomasi Harris 角点。
- 使用 Kanade-Lucas-Tomasi (KLT) 光流跟踪特征。
- 在五帧窗口内对之前丢失的特征进行重跟踪,以处理短时遮挡。
- 通过 RANSAC 下的 P3P 估计相机位姿,随后对重投影误差进行非线性 Levenberg–Marquardt 精化。
- 维护最近关键帧的窗口以进行局部束调整,使用鲁棒的Huber代价函数。
- 通过五点法估计本质矩阵并将平移尺度固定为 1 来初始化单目 VO。
实验结果
研究问题
- RQ1在浑浊的水下条件下,基于光流跟踪的单目 VO 系统能实现实时性能吗?
- RQ2在浑浊和动态遮挡下,基于 KLT 的跟踪比基于描述子的跟踪在水下 VO 中更鲁棒吗?
- RQ3基于关键帧的 VO 结合窗口化束调整在水下场景中是否提供精确且漂移最小化的轨迹?
- RQ4在水下数据集中,UW-VO 在准确性和鲁棒性方面与开源的单目 VO/V-SLAM 方法相比如何?
主要发现
- 在水下浑浊和动态遮挡条件下,基于 KLT 的 Harris 角点跟踪在特征保留方面优于基于描述子的跟踪。
- UW-VO 在标准 CPU 上以实时速度最高达到 30 Hz,每帧跟踪约 25 ms,处理新关键帧时约 35 ms。
- 五帧窗口的重跟踪机制提高了对由移动海洋生物引起的短时遮挡的鲁棒性。
- 带自适应关键帧窗口和鲁棒 Huber 成本的窗口化局部束调整减少了单目 VO 的尺度漂移。
- 在鲁棒性方面,UW-VO 在水下数据集上优于最先进的开源单目 VO 与 V-SLAM 方法,并在精度方面具有竞争力。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。