Skip to main content
QUICK REVIEW

[論文レビュー] Fast and Accurate Point Cloud Registration using Trees of Gaussian Mixtures

Benjamin Eckart, Kihwan Kim|arXiv (Cornell University)|Jul 6, 2018
Remote Sensing and LiDAR Applications参考文献 34被引用数 25
ひとこと要約

本論文では、GPUアクセラレートされたマルチスケールセグメンテーションを介して対数時間データアソシエーションを可能にする、ガウス・ミックスチャネル・ツリー(GMM-Tree)を用いた高速かつ高精度な点群登録手法を提案する。新たなPCAベースのマハラノビス距離近似を導入することで、LiDARおよび構造化照明スキャンを含む多様な3次元データセットにおいて、従来のGMMおよびICPベース手法と比較して、最高水準の精度を達成するとともに、最大10倍の高速化を実現した。

ABSTRACT

Point cloud registration sits at the core of many important and challenging 3D perception problems including autonomous navigation, SLAM, object/scene recognition, and augmented reality. In this paper, we present a new registration algorithm that is able to achieve state-of-the-art speed and accuracy through its use of a hierarchical Gaussian Mixture Model (GMM) representation. Our method constructs a top-down multi-scale representation of point cloud data by recursively running many small-scale data likelihood segmentations in parallel on a GPU. We leverage the resulting representation using a novel PCA-based optimization criterion that adaptively finds the best scale to perform data association between spatial subsets of point cloud data. Compared to previous Iterative Closest Point and GMM-based techniques, our tree-based point association algorithm performs data association in logarithmic-time while dynamically adjusting the level of detail to best match the complexity and spatial distribution characteristics of local scene geometry. In addition, unlike other GMM methods that restrict covariances to be isotropic, our new PCA-based optimization criterion well-approximates the true MLE solution even when fully anisotropic Gaussian covariances are used. Efficient data association, multi-scale adaptability, and a robust MLE approximation produce an algorithm that is up to an order of magnitude both faster and more accurate than current state-of-the-art on a wide variety of 3D datasets captured from LiDAR to structured light.

研究の動機と目的

  • 従来のICPおよびGMMベース登録手法が直面する遅い収束、ノイズ/遮蔽に対する脆弱性、高い計算コストといった限界を解消すること。
  • 階層的でGPUアクセラレートされたGMM表現を構築することで、複数スケールにわたる効率的で適応的なデータアソシエーションを可能にすること。
  • 等方的ガウス共分散の制約を回避するため、非等方的共分散を用いて真の最尤推定(MLE)を近似することで、精度を向上させること。
  • データアソシエーションの複雑さを対数時間に削減することで、自律走行やSLAMなどの応用分野におけるリアルタイム性能を達成すること。
  • 手動チューニングを必要とせず、点密度、シーンの複雑さ、幾何的分布の変動に適応可能な汎用登録フレームワークを提供すること。

提案手法

  • 並列GPUベースの尤度セグメンテーションを用いて、トップダウンかつ再帰的に小スケールGMMのツリーを構築し、点群のマルチスケール階層的表現を形成する。
  • 真のMLE解を完全に非等方的共分散下でよく近似する、新たなPCAベースの最適化基準を用いてマハラノビス距離近似を計算する。
  • 再帰的ツリー探索を実行することで、マッチングに最適なスケールを動的に選択し、対数時間複雑度を達成するデータアソシエーションを実現する。
  • 階層的構造を活用して、局所的なシーンの複雑さや空間的分布に応じて、幾何的詳細のレベルを適応的に調整する。
  • 剛体変換推定をサポートする、頑健で微分可能な最適化フレームワークとGMM-Tree表現を統合する。
  • データ駆動型のマルチスケールマッチングプロセスを採用し、サンプリングの疎らさや幾何的構造といったシーン固有の特性に自動的に適応する。

実験結果

リサーチクエスチョン

  • RQ1階層的GMM表現は、従来のICPおよびGMMベース手法と比較して、より高速かつ高精度な点群登録を可能にするか?
  • RQ2線形時間から対数時間にまでデータアソシエーションの複雑さを低減しつつ、高い精度を維持できるか?
  • RQ3一般の非等方的ガウス共分散下で、PCAベースのマハラノビス距離近似は真のMLE解を効果的に近似できるか?
  • RQ4提案手法は、点密度、ノイズ、幾何的複雑さが異なる多様な3次元データセットに一般化可能か?
  • RQ5ループクロージャーや外部オドメトリを用いずに、大規模LiDARデータにおいてリアルタイム性能(10 Hz未満)を達成できるか?

主な発見

  • 提案手法は、最先端のICPおよびGMMベース手法と比較して最大10倍の高速化を達成し、Velodyne LiDARデータ(1フレームあたり13,878点)では17–39 Hzのフレームレートを達成した。
  • Velodyne LiDARデータセットにおいて、ループクロージャーや外部オドメトリを一切使用せずに、都市ブロック規模の距離において1m未満の精度を維持した。
  • 精度面では、最良のICPバリアントと同等またはそれを上回り、次に速いGMMベース手法の約2倍の速度で動作した。
  • GMM-Tree表現により、データアソシエーションの複雑さがO(N²)からO(log J)に削減され、Jは混合成分の数を表す。
  • 完全に非等方的共分散下でも、PCAベースのマハラノビス近似は真のMLE解を良好に近似でき、等方的GMM手法に比べて耐障害性が向上した。
  • 構造化照明スキャンおよびLiDARスキャンを含む多様なデータセットにおいて、点密度、ノイズ、幾何的複雑さの変動にかかわらず、一貫した高速化と精度向上を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。