[論文レビュー] Locality-aware Gaussian Compression for Fast and High-quality Rendering
LocoGS は局所的整合性を利用した局所性対応型 3D ガウススプラッティング(3DGS)圧縮フレームワークを導入し、グリッドベースのニューラルフィールドを介してガウス属性の局所的一貫性を活用することで、品質を保ちながら大幅なストレージ削減と高速レンダリングを実現します。既存のコンパクトガウス表現よりも品質と速度で優れています。
We present LocoGS, a locality-aware 3D Gaussian Splatting (3DGS) framework that exploits the spatial coherence of 3D Gaussians for compact modeling of volumetric scenes. To this end, we first analyze the local coherence of 3D Gaussian attributes, and propose a novel locality-aware 3D Gaussian representation that effectively encodes locally-coherent Gaussian attributes using a neural field representation with a minimal storage requirement. On top of the novel representation, LocoGS is carefully designed with additional components such as dense initialization, an adaptive spherical harmonics bandwidth scheme and different encoding schemes for different Gaussian attributes to maximize compression performance. Experimental results demonstrate that our approach outperforms the rendering quality of existing compact Gaussian representations for representative real-world 3D datasets while achieving from 54.6$ imes$ to 96.6$ imes$ compressed storage size and from 2.1$ imes$ to 2.4$ imes$ rendering speed than 3DGS. Even our approach also demonstrates an averaged 2.4$ imes$ higher rendering speed than the state-of-the-art compression method with comparable compression performance.
研究の動機と目的
- ボリュームシーンのコンパクトなモデリングを可能にするため、3D ガウス属性の局所的一貫性を調査する。
- ミニマムなストレージで局所的に一貫したガウス属性をエンコードする局所性対応表現を開発する。
- 密な初期化、剪定、適応球面調和関数帯域幅、そして分 disparate なガウス属性のエンコードを組み合わせ、圧縮を最大化する。
- 元の 3DGS レンダリングパイプラインとの互換性を維持し、レンダリングスループットを変更せずに対応する。
提案手法
- Explicit(p, γ, k0)と implicit(o, ŝ, r, k1:L)グループにガウス属性を分割する局所性対応型 3D ガウス表現を提案する。
- 位置 p から per-Gaussian の暗黙属性を取得するために、マルチレゾリューションハッシュグリッドニュートラルフィールド F (Φθ) と小さな MLPs Θ を用いて暗黙属性をモデル化する。
- 各ガウスごとに適応 SH 帯域幅を使用し、b を最大 SH 次と関連マスキングとして用いて、L をガウスごとに変化させる。
- 最適化中のガウス数を減らすため、 Nerfacto由来の密な点群を用いた密な初期化とソフト移動マスクによるガウス剪定を適用する。
- Explicit 属性を位置の G-PCC(整数値への再解釈を通じたロスレス)でエンコードし、γ、k0、および b を量子化する。Gaussians を Morton order に沿ってソートした後にエントロピー符号化して関連性を保持する。暗黙属性(Φθ, Θ)は量子化/エントロピー符号化でエンコードしつつ、レンダリング精度を維持する。
実験結果
リサーチクエスチョン
- RQ1局所性対応エンコードされたガウス属性は、レンダリング品質を損なうことなくストレージを劇的に削減できるか。
- RQ2適応 SH 帯域幅は、実世界のシーン全体でレンダリング速度と視覚的忠実度にどのような影響を与えるか。
- RQ3初期化、剪定、エンコード戦略の組み合わせは、3D ガウス表現の最良の圧縮-速度-品質のトレードオフを生み出すか。
- RQ4元の 3DGS レンダリングパイプラインを変更せずに、より優れた圧縮を達成できるか。
- RQ5LocoGS は PSNR/SSIM/LPIPS、ストレージ、標準データセット上の FPS の点で、最先端のコンパクト表現とどう比較されるか。
主な発見
- 3DGS に対して 54.6x 〜 96.6x の圧縮ストレージを達成し、レンダリング品質は同等またはそれ以上。
- 3DGS に対して 2.1x 〜 2.4x のレンダリング速度の改善を達成。
- 類似の圧縮性能で、HAC より約 2.4x 高いレンダリング速度を示す。
- 局所性対応表現とターゲット化されたエンコードを使用することで、PSNR、SSIM、LPIPS の基準でベースラインを上回る。
- より高品質なコンパクト表現による剪定の積極的な適用を可能にし、レンダリングスループットを向上させる。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。