QUICK REVIEW
[論文レビュー] Classification of Point Cloud Scenes with Multiscale Voxel Deep Network
Xavier Roynard, Jean‐Emmanuel Deschaud|arXiv (Cornell University)|Apr 10, 2018
3D Surveying and Cultural Heritage参考文献 24被引用数 48
ひとこと要約
MS DeepVoxScene は複数スケールのボクセルグリッドを用いてシーン点群を分類するマルチスケール3D CNN を導入し、Semantic3Dで強力な結果を出し、クロスデータセットで競争力のある性能を示す。
ABSTRACT
In this article we describe a new convolutional neural network (CNN) to classify 3D point clouds of urban or indoor scenes. Solutions are given to the problems encountered working on scene point clouds, and a network is described that allows for point classification using only the position of points in a multi-scale neighborhood. On the reduced-8 Semantic3D benchmark [Hackel et al., 2017], this network, ranked second, beats the state of the art of point classification methods (those not using a regularization step).
研究の動機と目的
- 自動的な大規模な都市部および室内点群の semantic 分類を自律マッピングおよびナビゲーションのために動機づける。
- 高度に不均衡なシーンデータに対処するクラス表現のバランスを取るトレーニング戦略を開発する。
- 局所幾何と文脈を活用して堅牢なシーンラベリングを実現するマルチスケール3D CNN アーキテクチャを提案する。
提案手法
- 各エポックごとにランダム化されたクラスバランスサンプリングで完全アノテーション済みの登録点群を訓練する。
- サンプルされた点の周囲に3D占有グリッドを構築し、サイズが 32x32x32 のボクセル化入力を持つ3D CNN に供給する。
- 異なるボクセルサイズ(例:5 cm、10 cm、15 cm)のネットワークから特徴を集約し、それらの1024次元特徴ベクトルを最終分類前に結合することでマルチスケール variante(MS_K_DeepVoxScene)を用いる。
- 軸方向反転、ランダムヨー回転、ランダムスケーリング、遮蔽、 artefacts、ガウスノイズを含むデータ拡張を行い、ADAM によるクロスエントロピーで最適化する。
実験結果
リサーチクエスチョン
- RQ1マルチスケールのボクセルベースCNN は、局所ジオメトリの微細な情報と広範なシーン文脈の両方を捉え、点群のシーン分類の精度を高められるか。
- RQ2トレーニング時のクラスバランスサンプリング戦略は、低代表クラスの性能を改善するか。
- RQ3MS_K_DeepVoxScene は単一スケールのボクセルネットワークおよび最先端の点ベース手法と、Large-scale 3D scene datasets においてどのように比較されるか。
主な発見
- 提案された MS3_DVS(5 cm、10 cm、15 cm のボクセルを用いたマルチスケール)は、いくつかのデータセットで単一スケールの counterparts を上回る。
- この手法は reduced-8 Semantic3D ベンチマークで2位にランクされ、多くの点ベースの非正則化手法を上回っている。
- Paris-Lille-3D、Semantic3D、S3DIS を横断して、マルチスケールアプローチは、複数カテゴリ(例:建物および歩行者)に対する平均 F1 スコアおよびクラスごとの再現率を、単一スケールのベースラインと比較して改善している。
- VoxNet 風のベースライン(MS1_DVS)は、多くのデータセットでマルチスケールネットワークに劣っており、スケール融合のメリットを示している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。