Skip to main content
QUICK REVIEW

[論文レビュー] UrbanGS: A Scalable and Efficient Architecture for Geometrically Accurate Large-Scene Reconstruction

Changbai Li, Haodong Zhu|arXiv (Cornell University)|Feb 2, 2026
Advanced Vision and Imaging被引用数 0
ひとこと要約

UrbanGSは深度整合性D-Normal正規化、深度情報に適応した監督、および局所ジオメトリに基づく空間的適応ガウシアン剪定を導入し、拡張可能な分割で高忠実度かつメモリ効率の良い都市スケールの3Dガウシアンスプラッティング再構成を実現します。

ABSTRACT

While 3D Gaussian Splatting (3DGS) enables high-quality, real-time rendering for bounded scenes, its extension to large-scale urban environments gives rise to critical challenges in terms of geometric consistency, memory efficiency, and computational scalability. To address these issues, we present UrbanGS, a scalable reconstruction framework that effectively tackles these challenges for city-scale applications. First, we propose a Depth-Consistent D-Normal Regularization module. Unlike existing approaches that rely solely on monocular normal estimators, which can effectively update rotation parameters yet struggle to update position parameters, our method integrates D-Normal constraints with external depth supervision. This allows for comprehensive updates of all geometric parameters. By further incorporating an adaptive confidence weighting mechanism based on gradient consistency and inverse depth deviation, our approach significantly enhances multi-view depth alignment and geometric coherence, which effectively resolves the issue of geometric accuracy in complex large-scale scenes. To improve scalability, we introduce a Spatially Adaptive Gaussian Pruning (SAGP) strategy, which dynamically adjusts Gaussian density based on local geometric complexity and visibility to reduce redundancy. Additionally, a unified partitioning and view assignment scheme is designed to eliminate boundary artifacts and optimize computational load. Extensive experiments on multiple urban datasets demonstrate that UrbanGS achieves superior performance in rendering quality, geometric accuracy, and memory efficiency, providing a systematic solution for high-fidelity large-scale scene reconstruction.

研究の動機と目的

  • 都市環境の大規模3Dガウシアンスプラッティング(3DGS)における幾何的不整合とメモリ効率の低下を解消する。
  • 深度と法線の手掛かりを用いてすべてのガウシアンパラメータ(位置・回転)を更新する深度整合性D-Normal正規化フレームワークを開発する。
  • 局所ジオメトリと可視性に基づく冗長性を削減する空間適応ガウシアン剪定(SAGP)戦略を導入する。
  • 境界アーチファクトを抑制し、スケーラブルなマルチGPU再構成を可能にする分割と視点割り当て方式を設計する。
  • 都市スケールデータセット上で最先端のレンダリング品質・幾何精度・学習効率を実証する。

提案手法

  • 深度マップ勾配からD-Normalを導出し、疑似法線事前知識でレンダリング法線を監督する深度整合性D-Normal正規化。
  • 単眼深度アンカーと疎SfMポイントを逆深度損失とジオメトリ認識信頼度重みで整合させる深度整合性正規化。
  • RGB再構成損失、n-正規化、dn-正規化、深度損失を重み付きに結合した総合損失L_totalを提案する。
  • 局所ジオメトリ・可視性・視点頻度から各ボクセルの重要度を算出し冗長なガウシアンを剪定する空間適応ガウシアン剪定(SAGP)。
  • 分割と境界保存型の視点割り当てを用いて、境界アーチファクトを抑えつつ大規模再構成を並列化する。
  • SAGP剪定をブロック-wiseトレーニング前提の分割戦略として活用し、都市規模再構成をスケーラブルに進行させる。
Figure 2: UrbanGS training pipeline and core components. (a) Training Pipeline: Starting from coarse global Gaussians, we apply spatially adaptive Gaussian pruning to obtain compact priors, contract and partition the scene into blocks, assign camera views using geometric and SSIM-based criteria, and
Figure 2: UrbanGS training pipeline and core components. (a) Training Pipeline: Starting from coarse global Gaussians, we apply spatially adaptive Gaussian pruning to obtain compact priors, contract and partition the scene into blocks, assign camera views using geometric and SSIM-based criteria, and

実験結果

リサーチクエスチョン

  • RQ1深度と法線の手掛かりをどのように組み合わせて、大規模シーンの3Dガウシアンパラメータを総合的に最適化できるか。
  • RQ2深度認識の監督と適応重み付けにより、都市スケール再構成における多視点深度揃列と幾何的整合性を改善できるか。
  • RQ3都市環境において、メモリ効率とレンダリング・幾何忠実性のバランスをとるためのガウシアンプリミティブの効果的な剪定法は何か。
  • RQ4多GPU環境で境界のないスケーラブルな大規模再構成を実現する分割・視点割り当て戦略はどれか。
  • RQ5UrbanGSは既存の大規模3DGS手法と比較して、レンダリング品質・幾何精度・学習効率の点で優れているか。

主な発見

  • UrbanGSは複数の都市データセットで最先端のレンダリング品質と幾何品質を達成し、いくつかの大規模ベースラインを上回った。
  • 深度整合性D-Normal正規化により、ガウシアンの位置と回転を総合的に最適化し、表面忠実性を改善した。
  • 逆深度アンカーとジオメトリ認識信頼度項による深度整合性が、クロスビューの深度整合を強化した。
  • SAGPは前景・遠距離領域の細部を維持しつつ、メモリ使用量と学習時間を削減する。
  • 分割と境界保存型視点割り当てにより、都市スケールシーンの効率的な並列学習が可能となった。
  • アブレーション研究は、D-Normal正規化と深度整合性コンポーネントおよびSAGPと分割の有効性を示し、PSNR/SSIMの改善とメモリ削減などの効果を確認した。
Figure 3: Qualitative results of ours and other methods in image rendering on Mill-19 (Yu et al., 2022 ) and Urbanscene3D (Lin et al., 2022 ) .
Figure 3: Qualitative results of ours and other methods in image rendering on Mill-19 (Yu et al., 2022 ) and Urbanscene3D (Lin et al., 2022 ) .

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。