QUICK REVIEW

[論文レビュー] Fisher Information Field: an Efficient and Differentiable Map for Perception-aware Planning

Zichao Zhang, Davide Scaramuzza|arXiv (Cornell University)|Aug 7, 2020

Robotics and Sensor-Based Localization参考文献 65被引用数 27

ひとこと要約

本稿では、3次元ランドマークからの回転不変フィッシャー情報の事前計算を用いて、任意の6自由度ロボットポーズにおける局所化精度を定数時間で評価可能な、新規のボクセルベースマップ表現であるフィッシャー情報フィールド（FIF）を提案する。これにより、効率的で微分可能な認識対応型運動計画が可能となり、直接的な点群計算と比較して最大10倍の高速化と向上した局所化精度を達成する。

ABSTRACT

Considering visual localization accuracy at the planning time gives preference to robot motion that can be better localized and thus has the potential of improving vision-based navigation, especially in visually degraded environments. To integrate the knowledge about localization accuracy in motion planning algorithms, a central task is to quantify the amount of information that an image taken at a 6 degree-of-freedom pose brings for localization, which is often represented by the Fisher information. However, computing the Fisher information from a set of sparse landmarks (i.e., a point cloud), which is the most common map for visual localization, is inefficient. This approach scales linearly with the number of landmarks in the environment and does not allow the reuse of the computed Fisher information. To overcome these drawbacks, we propose the first dedicated map representation for evaluating the Fisher information of 6 degree-of-freedom visual localization for perception-aware motion planning. By formulating the Fisher information and sensor visibility carefully, we are able to separate the rotational invariant component from the Fisher information and store it in a voxel grid, namely the Fisher information field. This step only needs to be performed once for a known environment. The Fisher information for arbitrary poses can then be computed from the field in constant time, eliminating the need of costly iterating all the 3D landmarks at the planning time. Experimental results show that the proposed Fisher information field can be applied to different motion planning algorithms and is at least one order-of-magnitude faster than using the point cloud directly. Moreover,the proposed map representation is differentiable, resulting in better performance than the point cloud when used in trajectory optimization algorithms.

研究の動機と目的

運動計画中に点群からのフィッシャー情報の計算が、ランドマーク数に比例して線形に増加するという非効率性を解消すること。
6自由度ポーズの認識品質を微分可能に評価できるようにし、軌道最適化における性能を向上させること。
回転不変フィッシャー情報をボクセルグリッドに事前計算・保存することで、高速で再利用可能な計画を可能にすること。
視覚的に劣化した環境でも、ロボットポーズの局所化がどの程度可能かを定量化することで、能動的視覚局所化を支援すること。
回転依存性と位置情報の分離を図る専用マップ表現を設計し、効率的な計画を実現すること。

提案手法

フィッシャー情報フィールド（FIF）は、環境をボクセルグリッドとして表現し、各ボクセルにすべての3次元ランドマークからの回転独立成分のフィッシャー情報を格納する。
本手法は回転依存性と位置情報の分離を図り、コアとなるフィッシャー情報をボクセルグリッドに事前計算・保存できる。
任意の6自由度ポーズに対して、ボクセルグリッドからの補間位置情報と、方向に依存する可視性モデルを組み合わせることで、定数時間で完全なフィッシャー情報行列（FIM）を再構成する。
可視性モデルは多項式またはガウス過程（GP）回帰を用いて近似され、特定の視点からランドマークが見えているかどうかを推定する。
計画時におけるフィッシャー情報行列（FIM）は、補間と回帰を用いて効率的に計算され、すべての3次元ランドマークを走査する必要がなくなる。
可視性近似の滑らかさのおかげでマップは微分可能となり、最適化ベースのプランナでより優れた性能が得られる。

実験結果

リサーチクエスチョン

RQ1事前計算され、微分可能なマップ表現が、6自由度視覚局所化におけるフィッシャー情報の定数時間評価を可能にするか？
RQ2FIFは、運動計画において直接的な点群計算と比較して、効率性と正確性の面で優れているか？
RQ3FIFは、認識対応型計画において、視覚的に劣化した環境でも局所化成功率と正確性を向上させられるか？
RQ4可視性近似手法（例：多項式、GP）の中で、正確性、効率性、微分可能性のバランスを最も良く満たすのはどれか？
RQ5FIFは、視覚慣性オドメトリを用いた探索中に段階的に更新可能か？

主な発見

FIFは、直接的な点群処理と比較して、少なくとも1桁の高速化を達成し、軌道最適化では最大10倍の高速化を実現した。
FIFベースのマップ表現は微分可能であり、軌道最適化アルゴリズムにおいて点群よりも高い局所化正確性を達成した。
FIMの行列式を用い、50〜70サンプルのGP近似が、計画の成功確率と効率性の観点で最良の全体的性能を発揮した。
2次多項式近似は、FIMのトレースを指標にした場合、GPに比べて約10倍高速であり、性能の損失は最小限に抑えられた。
可視性モデルの形式を強制することで、事前計算ステップが実行可能となり、同じ環境での複数の計画セッションに再利用可能である。
本手法は、サンプリングベース（例：RRT*）および最適化ベースのプランナに効率的に統合可能であり、局所化成功確率と正確性の両方を向上させた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。