Skip to main content
QUICK REVIEW

[論文レビュー] RLFC: Random Access Light Field Compression using Key Views.

Srihari Pratapa, Dinesh Manocha|arXiv (Cornell University)|May 15, 2018
Advanced Vision and Imaging参考文献 8被引用数 4
ひとこと要約

RLFCは、階層的な木構造表現を用いて複数のビュー間の冗長性を活用する階層的光場圧縮方式であり、限定された整数列符号化によりランダムアクセスと高速ハードウェアデコードを実現する。40–50 dBのPSNRで20:1~200:1の圧縮比を達成し、512×512解像度で1チャンネルあたり1ミクロ秒未塔のデコード時間と200 fpsのビュー描画を実現する。

ABSTRACT

We present a new hierarchical compression scheme for encoding light field images (LFI) that is suitable for interactive rendering. Our method (RLFC) exploits redundancies in the light field images by constructing a tree structure. The top level (root) of the tree captures the common high-level details across the LFI, and other levels (children) of the tree capture specific low-level details of the LFI. Our decompressing algorithm corresponds to tree traversal operations and gathers the values stored at different levels of the tree. Furthermore, we use bounded integer sequence encoding which provides random access and fast hardware decoding for compressing the blocks of children of the tree. We have evaluated our method for 4D two-plane parameterized light fields. The compression rates vary from 0.08 - 2.5 bits per pixel (bpp), resulting in compression ratios of around 200:1 to 20:1 for a PSNR quality of 40 to 50 dB. The decompression times for decoding the blocks of LFI are 1 - 3 microseconds per channel on an NVIDIA GTX-960 and we can render new views with a resolution of 512X512 at 200 fps. Our overall scheme is simple to implement and involves only bit manipulations and integer arithmetic operations.

研究の動機と目的

  • 低遅延でインタラクティブレンダリングを実現する光場画像の効率的圧縮に挑む。
  • 4次元光場における複数のビュー間の冗長性を低減しつつ、高い視覚的品質を維持する。
  • リアルタイムアプリケーション向けにランダムアクセスと高速ハードウェアデコードを可能にする。
  • ビット演算と整数演算のみを用いたシンプルで並列処理に適した圧縮方式を開発する。

提案手法

  • 本手法は、光場全体の共通する高レベル特徴を捉えるルートノードを持つ階層的木構造を構築する。
  • 子ノードはビュー固有の低レベルの詳細を格納し、再構築されたビューの段階的精錬を可能にする。
  • 子ブロックデータの圧縮に限定された整数列符号化技術を適用し、ランダムアクセスと高速デコードを支援する。
  • デコード時の木の走査により、異なるレベルからの値を集約して完全な光場を再構築する。
  • 本手法はビット操作と整数演算のみを用いるため、効率的なハードウェア実装が可能である。
  • 本手法は、標準的な圧縮指標を用いて4次元2平面パラメータ化光場上で評価されている。

実験結果

リサーチクエスチョン

  • RQ1階層的な木構造ベースの圧縮モデルは、光場画像におけるビュー間の冗長性を効果的に活用できるか?
  • RQ2整数演算を用いた光場圧縮において、ランダムアクセスと高速デコードはどの程度効率的に達成できるか?
  • RQ3最小限の計算オーバーヘッドでどの程度の圧縮比と視覚的品質が達成できるか?
  • RQ4本手法はインタラクティブアプリケーション向けに高フレームレートでのリアルタイムレンダリングをサポートできるか?
  • RQ5低ビットレートを達成しつつ、どの程度高いPSNRを維持できるか?

主な発見

  • 本手法は、PSNR 40 dB~50 dBの範囲で20:1~200:1の圧縮比を達成する。
  • 圧縮レートは0.08~2.5ビット/ピクセルの範囲にあり、高い効率性を示す。
  • NVIDIA GTX-960 GPU上での1チャンネルあたりのデコード時間は1~3マイクロ秒である。
  • 本システムは512×512解像度のビューを200 fpsでリアルタイムレンダリングを可能にする。
  • 実用的にも非常に効率的であり、ビット操作と整数演算のみに依存している。
  • 本手法はランダムアクセスを可能にし、シンプルさからハードウェア加速に非常に適している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。