[论文解读] PIVO: Probabilistic Inertial-Visual Odometry for Occlusion-Robust Navigation
PIVO 提出了一种概率惯性-视觉里程计系统,通过在顺序、不确定性感知的框架中完全融合 IMU 和单目相机数据,实现了在标准智能手机上的鲁棒、抗遮挡导航。通过保持交叉协方差并利用 IMU 驱动的动力学模型与考虑特征不确定性的视觉更新,PIVO 即使在长时间相机遮挡期间也能实现精确的、度量尺度的跟踪。
This paper presents a novel method for visual-inertial odometry. The method is based on an information fusion framework employing low-cost IMU sensors and the monocular camera in a standard smartphone. We formulate a sequential inference scheme, where the IMU drives the dynamical model and the camera frames are used in coupling trailing sequences of augmented poses. The novelty in the model is in taking into account all the cross-terms in the updates, thus propagating the inter-connected uncertainties throughout the model. Stronger coupling between the inertial and visual data sources leads to robustness against occlusion and feature-poor environments. We demonstrate results on data collected with an iPhone and provide comparisons against the Tango device and using the EuRoC data set.
研究动机与目标
- 开发一种鲁棒的视觉-惯性里程计系统,以在长时间相机遮挡期间保持精确跟踪。
- 利用低成本智能手机传感器克服仅相机里程计在特征稀少或遮挡环境中的局限性。
- 在标准移动硬件上实现度量尺度、无漂移的跟踪,无需依赖外部传感器或回环检测。
- 提出一种保持姿态之间交叉协方差的顺序推理框架,以实现最优不确定性传播。
- 在如 iPhone 6 等消费级设备上展示实时性能和鲁棒性。
提出的方法
- 提出一种离散时间 IMU 传播模型,仅将误差源最小化为线性化误差。
- 采用一系列线性卡尔曼更新,增强后续姿态的同时保持当前与过去姿态之间的交叉协方差。
- 引入视觉更新步骤,通过积分估计的特征点坐标,将近似误差减少至仅在 EKF 框架中的线性化误差。
- 采用顺序推理方案,其中 IMU 驱动动力学模型,视觉帧用于连接增强的姿态序列。
- 应用概率公式化方法,处理更新方程中的所有交叉项,确保在一阶 EKF 意义下的最优不确定性传播。
- 通过确保计算复杂度随时间线性增长,使系统能够在移动硬件上实现实时运行。
实验结果
研究问题
- RQ1基于仅智能手机传感器的概率惯性-视觉里程计系统能否在长时间相机遮挡期间实现鲁棒跟踪?
- RQ2在特征稀少或遮挡环境中,姿态之间完整交叉协方差传播在多大程度上能提升系统鲁棒性?
- RQ3在顺序推理框架中,低精度 IMU 与单目视觉结合时,能在多大程度上提供可靠的度量尺度跟踪?
- RQ4基于仅 IMU 和单目相机数据的系统能否在具有挑战性的现实场景中优于以相机为中心的里程计方法?
- RQ5与忽略姿态估计协方差的方法相比,保持姿态状态间不确定性的方法在性能上表现如何?
主要发现
- PIVO 在 iPhone 6 上对一条 300 米长的城市和室内路径实现了精确的度量尺度轨迹估计,包括完全的相机遮挡。
- 即使在长时间遮挡期间(如相机被装在包中或被人群遮挡),系统仍能保持一致的尺度和低漂移。
- 基准测试显示,视觉更新步骤在 MacBook 笔记本电脑上处理 40 帧轨迹的平均耗时为 0.079 秒,处理 20 帧轨迹的平均耗时为 0.0052 秒,表明具备实时可行性。
- PIVO 在快速运动、低纹理和窄视场角等挑战性条件下优于以相机为中心的方法(如 ORB-SLAM2)。
- 该方法对滚动快门效应、光照变化和特征稀少具有鲁棒性,轨迹对齐与街道路线图高度匹配。
- 该方法实现了与 Tango 设备相当的性能,但仅使用标准智能手机硬件,无需专用深度传感器或外部标定。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。