QUICK REVIEW

[논문 리뷰] Deep Lambertian Networks

Yichuan Tang, Ruslan Salakhutdinov|arXiv (Cornell University)|2012. 06. 27.

Advanced Vision and Imaging참고 문헌 18인용 수 45

한 줄 요약

이 논문은 람베르티안 반사 모델을 결합한 다층 신뢰망을 사용하여 2D 이미지에서 알베도, 표면 법선, 조도를 분리하는 딥 생성 모델인 딥 람베르티안 네트워크를 제안한다. 조도 불변 사전 확률을 학습함으로써, 전이 학습과 분리된 표현을 통해 정확한 1샷 얼굴 인식을 가능하게 하여 표준 기준 모델을 능가한다.

ABSTRACT

Visual perception is a challenging problem in part due to illumination variations. A pos-sible solution is to first estimate an illumi-nation invariant representation before using it for recognition. The object albedo and surface normals are examples of such rep-resentations. In this paper, we introduce a multilayer generative model where the latent variables include the albedo, surface normals, and the light source. Combining Deep Be-lief Nets with the Lambertian reflectance as-sumption, our model can learn good priors over the albedo from 2D images. Illumina-tion variations can be explained by changing only the lighting latent variable in our model. By transferring learned knowledge from sim-ilar objects, albedo and surface normals es-timation from a single image is possible in our model. Experiments demonstrate that our model is able to generalize as well as im-prove over standard baselines in one-shot face recognition. 1.

연구 동기 및 목표

시각 인식에서 조도 변화 문제를 조도 불변 표현을 학습하여 해결하기 위해.
2D 이미지에서 알베도, 표면 법선, 조도 원천을 동시에 추정하는 딥 생성 모델을 개발하기 위해.
유사한 물체 간의 지식 전이를 통해 분리된 잠재 표현을 이용해 단일 이미지 기반 알베도 및 표면 법선 추정을 가능하게 하여 1샷 얼굴 인식을 실현하기 위해.
저자료 환경에서 표준 기준 모델 대비 일반화 능력과 성능 향상을 위해.

제안 방법

모델는 알베도, 표면 법선, 조도를 위한 잠재 변수를 모델링하기 위해 딥 벨리프 네트워크 기반의 다층 생성 네트워크를 사용한다.
물리적으로 타당한 이미지 생성을 보장하기 위해 람베르티안 반사 모델을 사전으로 통합한다.
잠재 변수는 2D 이미지에서 사전을 학습하기 위해 딥 벨리프 네트워크 프레임워크를 통해 엔드 투 엔드로 훈련된다.
조도 변화는 오직 조도 잠재 변수만 조정하여 조도 영향을 고유 성질에서 분리한다.
유사한 물체 간 지식 전이를 통해 단일 이미지에서 알베도 및 표면 법선 추정이 가능하다.
모델는 생성 학습을 활용하여 단일 입력 이미지에서 분리된 요소를 추론한다.

실험 결과

연구 질문

RQ1람베르티안 가정 하에 딥 생성 모델이 2D 이미지에서 알베도, 표면 법선, 조도를 효과적으로 분리할 수 있는가?
RQ2유사한 물체 간 지식 전이를 통해 이러한 모델이 1샷 얼굴 인식 작업에 잘 일반화되는가?
RQ3표준 기준 모델 대비 조도 불변 사전을 학습함으로써 인식 성능 향상이 이루어지는가?
RQ4단일 이미지 기반 알베도 및 표면 법선 추정은 얼마나 분리된 표현을 통해 달성될 수 있는가?

주요 결과

딥 벨리프 네트워크 프레임워크를 사용하여 2D 이미지에서 조도 불변 사전을 성공적으로 학습하였다.
조도 변화는 오직 조도 잠재 변수만 조정하여 효과적으로 설명되었으며, 알베도 및 법선은 유지되었다.
표준 기준 모델 대비 1샷 얼굴 인식에서 향상된 성능을 달성하였다.
유사한 물체 간 지식 전이를 통해 단일 이미지에서 정확한 알베도 및 표면 법선 추정이 가능하였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.