Skip to main content
QUICK REVIEW

[논문 리뷰] Practical Deep Stereo (PDS): Toward applications-friendly deep stereo matching

Stepan Tulyakov, A. B. Ivanov|arXiv (Cornell University)|2018. 06. 05.
Advanced Vision and Imaging인용 수 74
한 줄 요약

PDS는 메모리 효율적인 병목 매칭 모듈과 서브-픽셀 MAP/크로스 엔트로피 손실을 도입하여 전체 크기 이미지에서의 학습과 유연한 시차 범위를 가능하게 하며, 더 작은 메모리 사용으로 최첨단 성능을 달성한다.

ABSTRACT

End-to-end deep-learning networks recently demonstrated extremely good perfor- mance for stereo matching. However, existing networks are difficult to use for practical applications since (1) they are memory-hungry and unable to process even modest-size images, (2) they have to be trained for a given disparity range. The Practical Deep Stereo (PDS) network that we propose addresses both issues: First, its architecture relies on novel bottleneck modules that drastically reduce the memory footprint in inference, and additional design choices allow to handle greater image size during training. This results in a model that leverages large image context to resolve matching ambiguities. Second, a novel sub-pixel cross- entropy loss combined with a MAP estimator make this network less sensitive to ambiguous matches, and applicable to any disparity range without re-training. We compare PDS to state-of-the-art methods published over the recent months, and demonstrate its superior performance on FlyingThings3D and KITTI sets.

연구 동기 및 목표

  • 엔드-투-엔드 심층 스테레오 네트워크의 메모리 풋프린트를 감소시켜 더 큰 이미지 맥락과 실용적 배치를 가능하게 한다.
  • 재훈련 없이 테스트 시 시차 범위의 유연성을 허용한다.
  • 새로운 손실 및 추론 전략을 통해 서브-픽셀 정밀도와 수렴 속도를 향상시킨다.

제안 방법

  • 좌우 결합 디스크립터를 압축하여 컴팩트한 매칭 시그니처로 만드는 병목 매칭 모듈을 도입한다.
  • compact signatures를 처리하여 비용 볼륨을 생성하는 hourglass 형태의 정규화 네트워크를 사용한다.
  • 다중 모드 후포를 처리하고 즉석에서 시차 범위를 변경할 수 있도록 sub-pixel MAP 추정기를 사용한다.
  • 수렴 가속과 정확도 향상을 위해 이산화된 라플라스 타깃을 갖는 서브-픽셀 크로스 엔트로피 손실을 제안한다.
  • 대형 컨텍스트 정보를 활용하기 위해 전체 해상도 이미지로 학습한다.
  • 메모리를 줄이고 전체 이미지 학습을 지원하기 위해 Instance Normalization으로 정규화한다.

실험 결과

연구 질문

  • RQ1정확도를 희생하지 않으면서 심층 스테레오 네트워크의 메모리 풋프린트를 줄일 수 있는가?
  • RQ2전체 해상도 이미지로 학습하는 것이 맥락 기반 매칭 성능을 향상시키는가?
  • RQ3재훈련 없이 테스트 시 시차 범위를 변경하면서도 정확도를 유지할 수 있는가?
  • RQ4서브-픽셀 MAP 추론과 서브-픽셀 크로스 엔트로피 손실이 다중 모드 후포에 대한 견고성과 수렴 속도를 향상시키는가?

주요 결과

방법매개변수메모리3EPMAE수정
PDS (proposed)2.20.43.381.12
PSM Chang and Chen (2018)5.20.6n/a1.09
CRL Pang et al. (2017)780.26.201.32
iResNet-i2 Liang et al. (2018)430.24.571.40
DispNetCorr1D Mayer et al. (2016)420.1n/a1.68
LRCR Jie et al. (2018)309.08.672.02
GC Kendall et al. (2017)3.54.59.342.02
  • PDS는 FlyingThings3D에서 비교 방법들 중 3-pixels 에러(3PE)가 가장 작고 MAE가 두 번째로 작다.
  • PDS는 메모리 풋프린트가 가장 작고 파라미터 수가 적으면서도 재훈련 없이 다양한 시차 범위를 가능하게 한다.
  • 전체 해상도 이미지로 학습하면 특히 큰 이미지 맥 context를 사용할 때 성능이 개선된다.
  • 추론 시 SoftArgmin에서 서브-픽셀 MAP으로 전환하면 다중 모드 에러가 감소하고 시차 범위가 확장되어도 성능이 유지된다.
  • 서브-픽셀 크로스 엔트로피는 더 빠른 수렴과 개선된 3PE를 가져오며 MAE의 변화는 미미하다.
  • KITTI 벤치마크에서 PDS는 보고된 비교에서 KITTI’15에서 3위, KITTI’12에서 4위를 차지한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.