Skip to main content
QUICK REVIEW

[論文レビュー] MASC: Multi-scale Affinity with Sparse Convolution for 3D Instance Segmentation

Chen Liu, Yasutaka Furukawa|arXiv (Cornell University)|Feb 12, 2019
3D Shape Modeling and Analysis参考文献 19被引用数 81
ひとこと要約

MASCを導入する。スパース畳み込みベースのネットワークは意味スコアとマルチスケール点の親和性を予測し、提案なしで3D点をインスタンスへクラスタリングする。ScanNetで最先端の結果を達成。

ABSTRACT

We propose a new approach for 3D instance segmentation based on sparse convolution and point affinity prediction, which indicates the likelihood of two points belonging to the same instance. The proposed network, built upon submanifold sparse convolution [3], processes a voxelized point cloud and predicts semantic scores for each occupied voxel as well as the affinity between neighboring voxels at different scales. A simple yet effective clustering algorithm segments points into instances based on the predicted affinity and the mesh topology. The semantic for each instance is determined by the semantic prediction. Experiments show that our method outperforms the state-of-the-art instance segmentation methods by a large margin on the widely used ScanNet benchmark [2]. We share our code publicly at https://github.com/art-programmer/MASC.

研究の動機と目的

  • 大規模な室内シーンにおける堅牢な3Dインスタンスセグメンテーションの動機付け。
  • 全シーンのボクセル化された点群を効率的に処理するためにスパース畳み込みを活用する。
  • セマンティックスコアとマルチスケールボクセル親和性を予測してインスタンスへのクラスタリングを可能にする。
  • 学習済みの親和性とメッシュトポロジーを用いた簡易なクラスタリング手法を開発する。

提案手法

  • サブマニフォールドスパース畳み込みを用いたU-Netで全体シーンのボクセルグリッドを処理する。
  • 隣接ボクセル間で異なるスケールの複数の親和性ブランチと各ボクセルのセマンティックスコアを予測する。
  • 平均化したマルチスケール親和性とメッシュトポロジーに基づいてノードを統合するクラスタリングアルゴリズムを定義する。
  • 各インスタンスに対して、そのポイントからの多数決でセマンティックラベルを割り当てる。
  • スパース領域での局所的な親和性予測を改善するために、ランダム密化でデータを拡張する。

実験結果

リサーチクエスチョン

  • RQ1スパース畳み込みによるマルチスケール親和性予測は、効果的な提案なしの3Dインスタンスセグメンテーションを実現できるか。
  • RQ2提案したクラスタリングアルゴリズムは、予測された親和性とメッシュトポロジーをどう活用して一貫性のあるインスタンスを形成するか。
  • RQ3ScanNetの性能に対する2つの親和性スケールの使用の影響はどうか。
  • RQ4MASCはScanNetベンチマークで最先端手法とどう比較されるか。

主な発見

Methodavg浴室ベッド本棚キャビネット椅子カウンターカーテンその他写真・絵冷蔵庫ショーケースシンクソファテーブルトイレ
3d-SIS0.3821.0000.4320.2450.1900.5770.0130.2630.0330.3200.2400.0750.4220.8570.1170.6990.2710.8830.235
GSPN0.3060.5000.4050.3110.3480.5890.0540.0680.1260.2830.2900.0280.2190.2140.3310.3960.2750.8210.245
SGPN0.1430.2080.3900.1690.0650.2750.0290.0690.0000.0870.0430.0140.0270.0000.1120.3510.1680.4380.138
Ours0.4470.5280.5550.3810.3820.6330.0020.5090.2600.3610.4320.3270.4510.5710.3670.6390.3860.9800.276
  • ScanNetベンチマークの3Dインスタンスセグメンテーション(IoU 0.5でのAP)で最先端手法を上回る。
  • 提案手法 Ours は Table 1 の多くのカテゴリで3D-SIS、GSPN、SGPNを上回るスコアを達成。
  • クラスタリングに基づくマルチスケール親和性アプローチは、提案手法が提案なしの検出で強力なインスタンスセグメンテーションを実現。
  • インスタンスのセマンティックラベルは、その構成ポイントからの最大多数決で決定される。
  • データ密化と平面物体処理を取り入れ、同一平面上または平坦な物体のセグメンテーションを改善する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。