Skip to main content
QUICK REVIEW

[論文レビュー] GEOMetrics: Exploiting Geometric Structure for Graph-Encoded Objects

Edward J. Smith, Scott Fujimoto|arXiv (Cornell University)|Jan 31, 2019
3D Shape Modeling and Analysis被引用数 37
ひとこと要約

GEOMetrics は、ゼロ近傍グラフ畳み込みネットワーク(0N-GCN)、適応的なフェース分割、局所/グローバルの二重損失を導入し、画像から適応メッシュを再構成する。頂点数を大幅に減らしつつ ShapeNet で最先端の結果を達成する。

ABSTRACT

Mesh models are a promising approach for encoding the structure of 3D objects. Current mesh reconstruction systems predict uniformly distributed vertex locations of a predetermined graph through a series of graph convolutions, leading to compromises with respect to performance or resolution. In this paper, we argue that the graph representation of geometric objects allows for additional structure, which should be leveraged for enhanced reconstruction. Thus, we propose a system which properly benefits from the advantages of the geometric structure of graph encoded objects by introducing (1) a graph convolutional update preserving vertex information; (2) an adaptive splitting heuristic allowing detail to emerge; and (3) a training objective operating both on the local surfaces defined by vertices as well as the global structure defined by the mesh. Our proposed method is evaluated on the task of 3D object reconstruction from images with the ShapeNet dataset, where we demonstrate state of the art performance, both visually and numerically, while having far smaller space requirements by generating adaptive meshes

研究の動機と目的

  • 3D物体再構成のためのボクセルと点群に代わる、スケーラブルでディテール適応型のメッシュ表現を動機づける。
  • 頂点レベルの情報を保持し、メッシュ再構成の過剰平滑化を防ぐグラフベースの手法を開発する。
  • メッシュ表面の必要な箇所にディテールを集中させる適応的なフェース分割を導入する。
  • 局所的な表面ディテールとグローバルなメッシュ構造を同時に活用する学習目的を提案する。
  • Vertex数を削減しつつ ShapeNet で最先端の性能を実証する。

提案手法

  • グラフベースの更新を可能にしつつ頂点レベルの情報を保持するZero-Neighbor Graph Convolutional Networks (0N-GCN) を提案する。
  • 高曲率領域に頂点を追加して局所的なディテールを発現させる適応的なフェース分割手順を導入する。
  • 頂点位置ではなく表面を比較する微分可能な表面サンプリング損失を開発し、点対表面および表面対点のペナルティを可能にする。
  • メッシュをメッシュ-to-voxel ネットワークでエンコードしてグローバル構造をボクセル空間表現と整合させるグローバルなメッシュ損失を使用する。
  • 上記を最終目的関数 L = γ1 L_latent + γ2 L_PtS + γ3 L_Edge + γ4 L_Δλ に結合し、PtP を初期学習時のより高速な代理指標として用いる。

実験結果

リサーチクエスチョン

  • RQ10N-GCN によって頂点ごとの情報を保持すること、標準のGCNよりメッシュ再構成の品質を改善する可能性はあるか?
  • RQ2適応的なフェース分割は、均一な分割より局所的な幾何学的ディテールをよりよく捉えるか?
  • RQ3微分可能な表面ベースの損失(PtP、PtS)とグローバル潜在損失は、真の表面とグローバル構造への整合性を改善するか?
  • RQ4メッシュ-to-voxel 潜在エンコーディングは、メッシュ再構成に有意義なグローバル監視信号を提供するか?
  • RQ5ShapeNet における精度と頂点効率の観点で、GEOMetrics は既存のメッシュ手法および非メッシュ手法とどう比較されるか?

主な発見

カテゴリ3D-R2N2PSGN3MR頂点数 (PSG/N3MR)Pixel2Mesh頂点数 (Pixel2Mesh)Ours頂点数 (Ours)
平面41.4668.2062.1064271.12246689.00645.03
ベンチ34.0949.2935.8464257.57246672.11514.54
キャビネット49.8839.9321.0464260.39246659.52556.68
37.8050.7036.6664267.86246674.64509.33
椅子40.2241.6030.2564254.38246656.61619.13
モニター34.3840.5328.7764251.39246659.50449.65
ランプ32.3541.4027.9764248.15246658.65743.28
スピーカー45.3032.6119.4664248.84246649.53550.06
銃器28.3469.9652.2264273.20246688.36638.35
ソファ40.0136.5925.0464251.90246659.54561.79
テーブル43.7953.4428.4064266.30246666.33732.82
携帯電話42.3155.9527.9664270.24246673.65416.05
水上艇37.1051.2843.7164255.12246668.32526.04
平均39.0148.5833.8064259.72246667.37574.06
  • GEOMetrics は ShapeNet における単一画像からの3D再構成で最先端の性能を達成し、ほとんどのクラスで表面 F1 スコアが向上。
  • 平均して、GEOMetrics は基準法よりクラス表面サンプリングF1スコアを7.65ポイント向上させつつ、頂点数は平均574.06と少なくする。
  • 適応的なフェース分割は非均一なディテールを可能にし、Pixel2Mesh と比較して最大4.3倍の頂点削減を実現しつつディテールを向上。
  • 0N-GCN は局所的な頂点情報を保持するのに役立ち、標準の GCN や均一分割のアブレーションより性能向上に寄与。
  • 微分可能な表面サンプリング損失とグローバル潜在メッシュ-ボクセル目的関数の組み合わせは、より正確で全球的に一貫したメッシュ再構成を生み出す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。