Skip to main content
QUICK REVIEW

[論文レビュー] PF-Net: Point Fractal Network for 3D Point Cloud Completion

Zitian Huang, Yikuan Yu|arXiv (Cornell University)|Mar 1, 2020
3D Shape Modeling and Analysis参考文献 33被引用数 38
ひとこと要約

PF-Netは入力の部分的な点群を保持し、マルチスケールの fractal様デコーダと対立的損失を用いて欠落領域を階層的に予測し、高忠実度の3D点群完成を実現する。

ABSTRACT

In this paper, we propose a Point Fractal Network (PF-Net), a novel learning-based approach for precise and high-fidelity point cloud completion. Unlike existing point cloud completion networks, which generate the overall shape of the point cloud from the incomplete point cloud and always change existing points and encounter noise and geometrical loss, PF-Net preserves the spatial arrangements of the incomplete point cloud and can figure out the detailed geometrical structure of the missing region(s) in the prediction. To succeed at this task, PF-Net estimates the missing point cloud hierarchically by utilizing a feature-points-based multi-scale generating network. Further, we add up multi-stage completion loss and adversarial loss to generate more realistic missing region(s). The adversarial loss can better tackle multiple modes in the prediction. Our experiments demonstrate the effectiveness of our method for several challenging point cloud completion tasks.

研究の動機と目的

  • Incompleteな3D点群を既存の点を変更せず robustly 修復する動機づけ。
  • 空間配置を保持しつつ欠落ジオメトリを推定する階層的・マルチスケールの生成器を開発する。
  • novel multi-resolution encoder を用いて partial inputs から rich なマルチスケール特徴を抽出する。
  • 欠落領域を Point Pyramid Decoder で生成し、 genus-wise の歪みを低減して詳細を保持する。
  • 現実味を高め、多様な出力モードを扱うために multi-stage completion loss と adversarial loss を組み込む。

提案手法

  • Partial Point Cloud からのマルチスケール特徴を抽出するための Combined Multi-Layer Perception(CMLP)を備えた Multi-Resolution Encoder(MRE)を導入する。
  • エンコーダ用に Iterative Farthest Point Sampling(IFPS)を用いて複数の解像度で特徴点を取得する。
  • feature points に guided された three-scale の欠落領域点を出力する primary, secondary, そして detailed point layers を持つ階層的な Point Pyramid Decoder(PPD)を設計する。
  • 欠落領域の予測を欠落領域の ground-truth subsamples と比較する複数解像度の completion loss を採用する。
  • Discriminator が PF-Net により現実味のある欠落領域点群を生成するよう導く adversarial loss で訓練する。
  • completion loss と adversarial loss を結合した joint objective で、幾何学的忠実度と現実性のバランスを取る。

実験結果

リサーチクエスチョン

  • RQ1部分的な点群を修復する際、既存の構造を保持しつつ欠落領域のみを予測できるか。
  • RQ2マルチレゾリューションの特徴点主導型エンコーダ-デコーダが局所・グローバルな幾何を完全に活用して、予測領域のディテールを向上させるか。
  • RQ3階層的で fractal-like なデコーダが genus-wise の歪みを低減し、欠落領域のディテール保持を改善するか。
  • RQ4 adversarial training がリアリズムを向上させ、点群完成における多モード予測の問題を減らすか。

主な発見

カテゴリLGAN-AEPCN3D-CapsulePF-Net(vanilla)PF-Net
Airplane0.856 / 0.7220.800 / 0.8000.826 / 0.8810.284 / 0.2310.263 / 0.238
Bag3.102 / 2.9942.954 / 3.0633.228 / 2.7220.927 / 0.9340.926 / 0.772
Cap3.530 / 2.8233.466 / 2.6743.439 / 2.8441.308 / 1.0271.226 / 1.169
Car2.232 / 1.6872.324 / 1.7382.503 / 1.9130.616 / 0.4310.599 / 0.424
Chair1.541 / 1.4731.592 / 1.5381.678 / 1.5630.472 / 0.4200.487 / 0.427
Guitar0.394 / 0.3540.367 / 0.4060.298 / 0.4610.097 / 0.0940.108 / 0.091
Lamp3.181 / 1.9182.757 / 2.0033.271 / 1.9121.041 / 0.6161.037 / 0.640
Laptop1.206 / 1.0301.191 / 1.1551.276 / 1.2540.309 / 0.2440.301 / 0.245
Motorbike1.828 / 1.4551.699 / 1.4591.591 / 1.6640.524 / 0.4140.522 / 0.389
Mug2.732 / 2.9462.893 / 2.8213.086 / 2.9610.793 / 0.7760.745 / 0.739
Pistol1.113 / 0.9670.968 / 0.9581.089 / 1.0860.270 / 0.2370.252 / 0.244
Skateboard0.887 / 1.0200.816 / 1.2060.897 / 1.2620.289 / 0.2880.225 / 0.172
Table1.694 / 1.6011.604 / 1.7901.870 / 1.7490.505 / 0.4170.525 / 0.404
Mean1.869 / 1.6151.802 / 1.6621.927 / 1.7130.572 / 0.4710.555 / 0.458
CategoryLGAN-AEPCN3D-CapsulePF-Net(vanilla)PF-Net
Airplane3.357 / 1.1305.060 / 1.2432.676 / 1.4011.197 / 1.0061.091 / 1.070
Bag5.707 / 5.3033.251 / 4.3145.228 / 4.2023.946 / 4.0543.929 / 3.768
Cap8.968 / 4.6087.015 / 4.24011.04 / 4.7395.519 / 4.4705.290 / 4.800
Car4.531 / 2.5182.741 / 2.1235.944 / 3.5082.537 / 1.8482.489 / 1.839
Chair7.359 / 2.3393.952 / 2.3013.049 / 2.2071.998 / 1.8282.074 / 1.824
Guitar0.838 / 0.5361.419 / 0.6890.625 / 0.6620.435 / 0.4350.456 / 0.429
Lamp8.464 / 3.62711.61 / 7.1399.912 / 5.8475.252 / 3.0595.122 / 3.460
Laptop7.649 / 1.4133.070 / 1.4222.129 / 1.7331.291 / 1.0131.247 / 0.997
Motorbike4.914 / 2.0364.962 / 1.9228.617 / 2.7082.229 / 1.8762.206 / 1.775
Mug6.139 / 4.7353.590 / 3.5915.155 / 5.1683.228 / 3.3323.138 / 3.238
Pistol3.944 / 1.4244.484 / 1.4145.980 / 1.7821.267 / 1.0121.122 / 1.055
Skateboard5.613 / 1.6833.025 / 1.74011.49 / 2.0441.198 / 1.2571.136 / 1.337
Table2.658 / 2.4842.503 / 2.4523.929 / 3.0982.184 / 1.9282.235 / 1.934
Mean5.395 / 2.6034.360 / 2.6615.829 / 3.0082.483 / 2.0862.426 / 2.117
  • PF-Net は全体的な完成品質と欠落領域の品質の両方で、ほとんどのカテゴリにおいてベースライン手法を上回る。
  • Discriminator の組み込みにより、多くのカテゴリで予測品質が向上する。
  • CMLP と MR-CMLP は特徴抽出性能を高め、PF-Net は PPD デコーダを通じてディテール保持をさらに改善。
  • モデルは欠落入力の異なる程度(25%、50%、75%)に対して堅牢であり、複数の欠損部にも対応可能。
  • 定量的結果は PF-Net および PF-Net (vanilla) が多くのカテゴリで Pred→GT および GT→Pred エラーを低くし、13カテゴリの平均でも優位を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。