Skip to main content
QUICK REVIEW

[論文レビュー] Single-Image Depth Perception in the Wild

Weifeng Chen, Fu Zhao|arXiv (Cornell University)|Apr 13, 2016
Advanced Vision and Imaging参考文献 27被引用数 98
ひとこと要約

この研究は、相対深度アノテーションを用いた Depth in the Wild (DIW) データセットを導入し、単一画像からメトリック深度を予測するエンドツーエンドの深層ネットワークを提示します。野外の画像で相対深度 supervision を使用し、最先端の性能を達成しています。

ABSTRACT

This paper studies single-image depth perception in the wild, i.e., recovering depth from a single image taken in unconstrained settings. We introduce a new dataset "Depth in the Wild" consisting of images in the wild annotated with relative depth between pairs of random points. We also propose a new algorithm that learns to estimate metric depth using annotations of relative depth. Compared to the state of the art, our algorithm is simpler and performs better. Experiments show that our algorithm, combined with existing RGB-D data and our new relative depth annotations, significantly improves single-image depth perception in the wild.

研究の動機と目的

  • 制約のない実世界環境(野外)での単一画像からの深度推定を動機づける。
  • 多様な画像に対して相対深度アノテーションを備えた大規模データセット(Depth in the Wild)を作成する。
  • 相対深度の監視付きで訓練されたエンドツーエンドのディープネットワークを開発し、メトリック深度を予測する。
  • DIW を既存の RGB-D データと組み合わせることで、野外深度推定が改善されることを示す。

提案手法

  • 495K の多様な野外画像に対して相対深度アノテーションをクラウドソースし、各画像から1組の点対をサンプリングする。
  • 相対深度損失で訓練された、ピクセル単位のメトリック深度を出力するエンドツーエンドのディープネットワークを提案する。
  • スケール間の情報伝搬を可能にする、マルチスケールのhourglass風アーキテクチャとスキップ接続を用いて、情報をスケール間へ伝搬させる。
  • クエリされた点対の深度の順序付けと等号を強制するランキング風損失で訓練する。
  • NYU Depth(室内)と DIW データセット(野外)で評価し、従来手法より改善を示す。

実験結果

リサーチクエスチョン

  • RQ1野外画像に対する相対深度アノテーションを用いて、単一画像から正確なメトリック深度を学習できるか?
  • RQ2相対深度損失で訓練されたエンドツーエンドのネットワークは、野外での序数依存性ベースの手法やRGB-D監視ベースのベースラインを上回るか?
  • RQ3RGB-D データでの事前学習と DIW でのファインチューニングが、多様なシーン(室内外)での性能にどのように影響するか?

主な発見

  • 提案手法は、以前の方法よりも序数的一貫性が高いピクセル単位の深度を生成する。
  • NYU Depth では、本手法は Zoran らの ordinal relations を上回り、full metric data で訓練された Eigen の深度推定に近づく。
  • Depth in the Wild では、NYU Depth で事前学習し DIW でファインチューニングすることで最良の WHDR スコアを提供し、屋外および室内シーンで顕著な改善を示す。
  • 既存の RGB-D データと DIW アノテーションを組み合わせることで、野外での単一画像深度推定が大幅に改善される。
  • ランダムな点対での訓練(スーパーゼルピックスの代わり)では、画像あたり十分な点対を使用すれば、性能が同等または上回る可能性がある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。