Skip to main content
QUICK REVIEW

[논문 리뷰] Locality-aware Gaussian Compression for Fast and High-quality Rendering

Seodong Shin, Jaesik Park|arXiv (Cornell University)|2025. 01. 10.
Computer Graphics and Visualization Techniques인용 수 3
한 줄 요약

LocoGS는 격자 기반 신경 필드를 통해 가우시안 속성의 지역 일관성을 활용하여 저장 용량을 크게 줄이고 렌더링 속도를 높이면서 품질을 보존하는 로컬리티 인지 3D 가우시안 스플래팅(3DGS) 압축 프레임워크를 도입합니다. 이는 품질과 속도 측면에서 기존의 컴팩트 가우시안 표현들을 능가합니다.

ABSTRACT

We present LocoGS, a locality-aware 3D Gaussian Splatting (3DGS) framework that exploits the spatial coherence of 3D Gaussians for compact modeling of volumetric scenes. To this end, we first analyze the local coherence of 3D Gaussian attributes, and propose a novel locality-aware 3D Gaussian representation that effectively encodes locally-coherent Gaussian attributes using a neural field representation with a minimal storage requirement. On top of the novel representation, LocoGS is carefully designed with additional components such as dense initialization, an adaptive spherical harmonics bandwidth scheme and different encoding schemes for different Gaussian attributes to maximize compression performance. Experimental results demonstrate that our approach outperforms the rendering quality of existing compact Gaussian representations for representative real-world 3D datasets while achieving from 54.6$ imes$ to 96.6$ imes$ compressed storage size and from 2.1$ imes$ to 2.4$ imes$ rendering speed than 3DGS. Even our approach also demonstrates an averaged 2.4$ imes$ higher rendering speed than the state-of-the-art compression method with comparable compression performance.

연구 동기 및 목표

  • 3D 가우시안 속성의 지역 일관성을 조사하여 체적 장면의 컴팩트한 모델링 가능성을 확보한다.
  • 최소한의 저장으로 로컬로 일관된 가우시안 속성을 인코딩하는 로컬리티 인지 표현을 개발한다.
  • 밀집 초기화, 가지치기, 적응형 구면조화( SH ) 대역폭, 그리고 서로 다른 가우시안 속성에 맞춘 인코딩을 통합하여 압축을 극대화한다.
  • 렌더링 처리량을 수정하지 않고 원래 3DGS 렌더링 파이프라인과의 호환성을 보장한다.

제안 방법

  • 가 Explicit( p, γ, k0 ) 및 Implicit( o, ŝ, r, k1:L ) 그룹으로 가우시안 속성을 분리하는 로컬리티 인지 3D 가우시안 표현을 제안한다.
  • 위치 p로부터 각 가우시안의 암묵적 속성을 검색하기 위해 다중 해상도 해시 그리드 신경 필드 F(Φθ)와 작은 MLPs Θ를 사용한다.
  • 각 가우시안별로 최대 SH 차수를 나타내는 b와 해당 마스킹을 사용하여 L을 가우시안별로 다르게 조정하는 적응형 SH 대역폭을 적용한다.
  • 최적화 중 가우시안 수를 줄이기 위해 Nerfacto에서 파생된 Dense 포인트 클라우드를 사용한 Dense 초기화와 부드러운 이동 마스크를 통한 가우시안 가지치기를 적용한다.
  • 위치 p에 대해 재해석을 통해 무손실로 위치를 포함하는 포지션(들)과 γ, k0, 그리고 b를 양자화하고,Gaussians를 Morton 순서로 정렬한 후 이들 간의 연관성을 보존하면서 엔트로피 코딩한다; Implicit 속성(Φθ, Θ)은 양자화/엔트로피 코딩으로 인코딩하되 렌더링 정확도를 유지한다.

실험 결과

연구 질문

  • RQ1로컬리티 인지 가우시안 속성 인코딩이 렌더링 품질을 희생하지 않으면서 저장 용량을 크게 줄일 수 있는가?
  • RQ2적응형 SH 대역폭이 실제 장면에서 렌더링 속도와 시각적 충실도에 어떤 영향을 미치는가?
  • RQ3초기화, 가지치기 및 인코딩 전략의 조합이 3D 가우시안 표현의 최적의 압축-속도-품질 트레이드오프를 제공하는가?
  • RQ4렌더링 처리량을 수정하지 않고도 원래의 3DGS 렌더링 파이프라인을 유지하면서 더 우수한 압축을 달성할 수 있는가?
  • RQ5LocoGS가 PSNR/SSIM/LPIPS, 저장 용량 및 표준 데이터 세트의 FPS 측면에서 최신 컴팩트 표현과 비교하여 어떤 차이가 있는가?

주요 결과

  • 3DGS 대비 54.6x~96.6x의 압축 저장 용량을 달성하되 렌더링 품질은 동등하거나 더 우수하다.
  • 3DGS 대비 2.1x~2.4x의 렌더링 속도 향상을 달성한다.
  • 동일한 압축 성능으로 HAC보다 약 2.4x 더 빠른 렌더링 속도를 시현한다.
  • 로컬리티 인지 표현과 표적 인코딩을 사용하면서 PSNR, SSIM, LPIPS에서 기본선보다 우수한 성능을 보인다.
  • 품질이 향상된 컴팩트 표현으로 인해 공격적인 가지치기가 가능해 렌더링 처리량이 향상된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.