[論文レビュー] ASSANet: An Anisotropic Separable Set Abstraction for Efficient Point Cloud Representation Learning
ASSANetは PointNet++ の SA を Anisotropic Separable SA (ASSA) に置き換え、分類、セグメンテーション、パーツセグメンテーションのベンチマークで推論を高速化し、精度を向上させます。
Access to 3D point cloud representations has been widely facilitated by LiDAR sensors embedded in various mobile devices. This has led to an emerging need for fast and accurate point cloud processing techniques. In this paper, we revisit and dive deeper into PointNet++, one of the most influential yet under-explored networks, and develop faster and more accurate variants of the model. We first present a novel Separable Set Abstraction (SA) module that disentangles the vanilla SA module used in PointNet++ into two separate learning stages: (1) learning channel correlation and (2) learning spatial correlation. The Separable SA module is significantly faster than the vanilla version, yet it achieves comparable performance. We then introduce a new Anisotropic Reduction function into our Separable SA module and propose an Anisotropic Separable SA (ASSA) module that substantially increases the network's accuracy. We later replace the vanilla SA modules in PointNet++ with the proposed ASSA module, and denote the modified network as ASSANet. Extensive experiments on point cloud classification, semantic segmentation, and part segmentation show that ASSANet outperforms PointNet++ and other methods, achieving much higher accuracy and faster speeds. In particular, ASSANet outperforms PointNet++ by $7.4$ mIoU on S3DIS Area 5, while maintaining $1.6 imes $ faster inference speed on a single NVIDIA 2080Ti GPU. Our scaled ASSANet variant achieves $66.8$ mIoU and outperforms KPConv, while being more than $54 imes$ faster.
研究の動機と目的
- モバイルおよび組み込みデバイスのための効率的な点群処理を動機付ける。
- PointNet++ SAのボトルネックを調査し、より高速な代替案を提案する。
- 精度を向上させつつ遅延を増やさない separable SAとAnisotropic Reductionを開発する。
- PointNet++ SAをASSAに置換してASSANetアーキテクチャを形成する。
- ASSANetの幅と深さのスケーリングによるスケーラビリティを実証する。
提案手法
- PreConv SAを導入し、グループ化前の点特徴にMLPを適用する。
- Separable SAを開発し、学習をプリグルーピングとポストグルーピングMLPに分割し、残差接続を備える。
- Anisotropic Reductionを提案し、縮小時に近傍の相対位置を用いて特徴をスケールする。
- ASSAをPointNet++に統合してASSANetを形成し、分類、セマンティックセグメンテーション、パーツセグメンテーションで評価する。
- ASSANetを幅( C )と深さ(D)でスケールし、より大きなバリアント(例:ASSANet (L))を作成する。
- PointNet++、PVCNN、KPConv、PosPool、DeepGCN ほかと対比結果を提供する。
実験結果
リサーチクエスチョン
- RQ1PointNet++のSAボトルネックを精度を犠牲にせず緩和できるか?
- RQ2 separable処理とanisotropic reductionは近傍特徴集合の速度と精度の両方を改善するか?
- RQ3ASSANetは標準的な3Dタスク(分類、セマンティックセグメンテーション、パーツセグメンテーション)で最先端手法と比較してどうか?
- RQ4ASSANetの幅と深度のスケーリングは精度と速度のトレードオフにどのような影響を与えるか?
主な発見
| Methods | mIoU (%) | Inference Speed (ins./sec.) |
|---|---|---|
| PointNet | 41.1 | 185.0 |
| DeepGCN | 52.5 | 0.8 |
| PointCNN | 57.3 | 124.1 |
| Grid-GCN | 57.8 | 123.5 |
| PVCNN | 59.0 | 89.8 |
| PosPool* (S) | 61.3 | 21.0 |
| SegGCN | 63.6 | 29.3 |
| KPConv | 65.4 | 1.2 (24.2) |
| PosPool* | 66.7 | 8.3 |
| PointNet++ | 55.6 | 116.6 |
| ASSANet | 63.0 (+7.4) | 188.6 (1.6x) |
| ASSANet (L) | 66.8 (+11.2) | 65.6 |
- ASSANetは S3DIS Area-5で PointNet++より7.4ポイント高いmIoUを達成し、推論は1.6x高速。
- ASSANet (L) は S3DIS Area-5で66.8 mIoUに到達し、いくつかの手法を上回る精度で、DeepGCNより294x、KPConvより54.6x高速。
- ModelNet40分類では ASSANet が 92.4% OA (+1.7) を2.1xの速度で、ASSANet (L) が 92.9% OA (+2.2) を1.3xの速度で達成。
- ShapeNetPartでは ASSANet と ASSANet (L) が PointNet++ を上回り、特に高速。ASSANet (L) は KPConvより約7.8x高速。
- アブレーション実験は PreConv SA、Separable SA、特に ASSA が vanilla SA に比べて速度と精度を向上させ、Anisotropic Reduction が最良の精度向上を提供することを示す。
- スケーリング分析は幅と深さの増加が可読性の高い速度変化で精度を改善し、高い幅でのリターンは減少することを示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。