QUICK REVIEW

[논문 리뷰] Backprop KF: Learning Discriminative Deterministic State Estimators

Tuomas Haarnoja, Anurag Ajay|arXiv (Cornell University)|2016. 05. 23.

Human Pose and Action Recognition참고 문헌 23인용 수 101

한 줄 요약

논문은 입력으로 이미지와 같은 고차원 관찰을 다룰 수 있도록 역전파로 학습되는 차별적이고 결정론적 상태 추정기인 Backprop KF (BKF)를 제시한다. BKF는 Kalman filter를 차별적으로 확장한 계산 그래프를 통해 엔드-투-엔드로 역전파 학습이 가능하게 하여, 이미지와 같은 고차원 관찰로부터의 입력을 처리한다.

ABSTRACT

Generative state estimators based on probabilistic filters and smoothers are one of the most popular classes of state estimators for robots and autonomous vehicles. However, generative models have limited capacity to handle rich sensory observations, such as camera images, since they must model the entire distribution over sensor readings. Discriminative models do not suffer from this limitation, but are typically more complex to train as latent variable models for state estimation. We present an alternative approach where the parameters of the latent state distribution are directly optimized as a deterministic computation graph, resulting in a simple and effective gradient descent algorithm for training discriminative state estimators. We show that this procedure can be used to train state estimators that use complex input, such as raw camera images, which must be processed using expressive nonlinear function approximators such as convolutional neural networks. Our model can be viewed as a type of recurrent neural network, and the connection to probabilistic filtering allows us to design a network architecture that is particularly well suited for state estimation. We evaluate our approach on synthetic tracking task with raw image inputs and on the visual odometry task in the KITTI dataset. The results show significant improvement over both standard generative approaches and regular recurrent neural networks.

연구 동기 및 목표

전체 관측 분포를 모델링하지 않고 고차원 관찰을 처리하는 차별적 상태 추정의 필요성 및 동기를 제시한다.
엔드-투-엔드 학습이 가능하도록 상태 추정기의 결정론적 계산 그래프 형식을 제안한다.
칼만 필터 코어를 통해 도메인 지식을 도입하되 표현력이 높은 관측 모델(예: CNNs)을 허용한다.
표준 생성적 방법 및 일반 RNN 대비 비전 기반 추적 및 KITTI 비주얼 오도메트리에서 향상된 성능을 입증한다.

제안 방법

관측 모델 g_theta(o_t)를 판별적으로 학습시키면서 칼만 필터를 언롤링하여 결정론적 계산 그래프를 구성한다.
κ(s_{t-1}, z_t), q(s_t), 및 l(φ_{y_t})를 미분하여 시간 역전파(BPTT)로 엔드-투-엔드 학습한다.
원시 관측 o_t를 처리하는 CNN에서 z_t와 R_t를 출력하여 필터가 관측 불확실성을 가중치로 반영하도록 한다.
상태 업데이트를 위해 확장 칼만 필터(또는 KF 변형)를 사용하고 관측 네트워크와 필터 파라미터를 함께 최적화한다.
아키텍처를 확률적 필터링에 기반을 두되 전체 모델은 결정론적 RNN 유사 계산 그래프로 취급한다.

실험 결과

연구 질문

RQ1이미지와 같은 고차원 관찰을 다룰 때 확률적 필터의 구조에 맞춘 차별적이고 결정론적 상태 추정기가 전통적 생성 필터를 능가할 수 있는가?
RQ2관찰 모델과 필터의 엔드-투-엔드 학습이 부분적(조각별) 학습 및 일반 RNN에 비해 비전 기반 작업(가려짐이 있는 트래킹 및 KITTI 비주얼 오도메트리)의 상태 추정 정확도를 향상시키는가?
RQ3관측 의존적 불확실성(R_t)을 도입하는 것이 가려짐 및 노이즈 하에서 추정 성능에 어떤 영향을 미치는가?

주요 결과

BKF는 가려짐이 있는 합성 시각 추적 작업에서 표준 생성적 KF 기반 추정기와 일반 LSTM을 능가한다.
BKF는 RMS 추적 오차(0.0537)가 피드포워드(0.2322), 부분 KF(0.1160), 및 LSTM 변형(0.1407–0.1423)보다 낮다.
KITTI 비주얼 오도메트리에서 BKF는 다양한 학습 세트 크기에서 부분 KF 및 LSTM 기본값에 비해 더 우수한 병진 및 회전 정확도를 보인다.
CNN 기반 관측 모델로 엔드-투-엔드 학습은 필터가 관측 불확실성(R_t)을 최적의 최종 상태 추정 성능을 최대화하도록 적응하게 한다.
BKF는 KF 구조라는 도메인 지식을 활용하면서 표현력이 높은 차별적 관측 처리의 이점을 누리고 데이터 효율성의 이점을 유지한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.