[论文解读] GNIO: Gated Neural Inertial Odometry
GNIO 引入 Motion Bank 与 Gated Prediction Head,以提升惯性里程计在公开基准上的漂移更低、泛化性更强,相较于 CNN/Transformer 基线。
Inertial navigation using low-cost MEMS sensors is plagued by rapid drift due to sensor noise and bias instability. While recent data-driven approaches have made significant strides, they often struggle with micro-drifts during stationarity and mode fusion during complex motion transitions due to their reliance on fixed-window regression. In this work, we introduce Gated Neural Inertial Odometry (GNIO), a novel learning-based framework that explicitly models motion validity and context. We propose two key architectural innovations: \ding{182} a learnable Motion Bank that queries a global dictionary of motion patterns to provide semantic context beyond the local receptive field, and \ding{183} a Gated Prediction Head that decomposes displacement into magnitude and direction. This gating mechanism acts as a soft, differentiable Zero-Velocity Update (ZUPT), dynamically suppressing sensor noise during stationary periods while scaling predictions during dynamic motion. Extensive experiments across four public benchmarks demonstrate that GNIO significantly reduces position drift compared to state-of-the-art CNN and Transformer-based baselines. Notably, GNIO achieves a $60.21\%$ reduction in trajectory error on the OxIOD dataset and exhibits superior generalization in challenging scenarios involving frequent stops and irregular motion speeds.
研究动机与目标
- 通过利用成本低廉的 MEMS IMU 解决 stationary/低速时的漂移与动态运动中的模式混淆,来推动更好的长期惯性导航。
- 提出提供语义运动上下文与自适应、软零速更新的架构创新。
- 在多个人体导向数据集上将 GNIO 与最先进的 CNN 和 Transformer 基线进行对比评估。
提出的方法
- 引入 Motion Bank:一个可学习的全局运动原型字典,通过多头注意力查询,提供超出局部 IMU 窗口的语义上下文。
- 开发一个 Gated Prediction Head,将位移分解为幅值分支(Softplus)和方向门控(Tanh),实现静止时的软零速更新(soft ZUPT)。
- 通过残差连接对丰富特征进行融合,产生位移和不确定性估计,以用于紧耦合的 EKF 融合。
- 采用两阶段损失:稳定收敛的 MSE 与对预测协方差与残差对齐的 Gaussian NLL。
- 采用随机克隆 EKF 将学习到的位移与高频 IMU 运动学紧耦合融合。
实验结果
研究问题
- RQ1全局 Motion Bank 是否能改善基于 IMU 的里程计在静止与动态运动之间的歧义?
- RQ2门控的幅值-方向分解是否能降低漂移并提高对停止与非均匀速度的鲁棒性?
- RQ3GNIO 相对于基于 CNN 和 Transformer 的基线在多个面向行人的数据集上表现如何?
- RQ4运动库大小与门控激活选择对估计精度有何影响?
主要发现
- 与最先进的 CNN 与 Transformer 基线在公开基准上的轨迹误差显著降低(如 OxIOD 上最高降幅达 60.21%)。
- Motion Bank 提供全局语义先验,有助于在多样化运动模式下解决模式混淆与漂移。
- Gated Prediction Head 在静止期有效抑制漂移,在动态运动时放大预测,起到软零速的作用。
- 消融研究显示 Motion Bank 与 Gated Head 均对 RMSE 有贡献,完整的 GNIO 框架达到最佳性能。
- GNIO 展现出对未见对象、传感器放置位置及频繁停靠的强泛化能力,适用于 OxIOD、RIDI、RoNIN、IDOL 与 TLIO 派生数据集。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。