QUICK REVIEW

[논문 리뷰] Exploiting temporal and depth information for multi-frame face anti-spoofing

Zezheng Wang, Chenxu Zhao|arXiv (Cornell University)|2018. 11. 13.

Biometric Identification and Security참고 문헌 32인용 수 77

한 줄 요약

이 논문은 짧은-기간 및 장기 모션 단서를 결합한 깊이-supervised 다중 프레임 얼굴 위조 방지 프레임워크(OFFB 및 ConvGRU)와 대조적 깊이 손실을 도입하여 네 가지 벤치마크에서 최첨단 성능을 달성합니다.

ABSTRACT

Face anti-spoofing is significant to the security of face recognition systems. Previous works on depth supervised learning have proved the effectiveness for face anti-spoofing. Nevertheless, they only considered the depth as an auxiliary supervision in the single frame. Different from these methods, we develop a new method to estimate depth information from multiple RGB frames and propose a depth-supervised architecture which can efficiently encodes spatiotemporal information for presentation attack detection. It includes two novel modules: optical flow guided feature block (OFFB) and convolution gated recurrent units (ConvGRU) module, which are designed to extract short-term and long-term motion to discriminate living and spoofing faces. Extensive experiments demonstrate that the proposed approach achieves state-of-the-art results on four benchmark datasets, namely OULU-NPU, SiW, CASIA-MFSD, and Replay-Attack.

연구 동기 및 목표

시간적 깊이가 살아있는 얼굴과 위조 얼굴을 구분하는 데 어떤 역할을 하는지 분석합니다.
RGB 프레임의 시간 정보를 활용하는 깊이 감독 아키텍처를 개발합니다.
PAD를 위한 짧은-기간 및 긴-기간 모션을 포착하는 메커니즘(OFFB 및 ConvGRU)을 도입합니다.
깊이 감독하에 얼굴 형상 학습을 위한 대조적(depth) 손실을 제안합니다.
표준 PAD 벤치마크에서 우수한 성능을 입증합니다.

제안 방법

단안 RGB 프레임으로부터 깊이를 추정하는 깊이 감독 네트워크를 사용합니다.
절대 깊이 손실과 대조적(depth) 손실을 함께 사용하는 단일 프레임 깊이 회귀를 사용합니다.
OFFB(Optical Flow Guided Feature Block)로 짧은-기간 모션을 추출합니다.
ConvGRU(Convolutional Gated Recurrent Units)로 긴-기간 모션을 포착합니다.
단일 프레임 깊이 맵과 다중 프레임 깊이 맵을 잔차와 같은 융합 방식을 통해 D_fusion으로 결합합니다.
두 단계 전략으로 학습합니다: 먼저 단일 프레임 부분을 고정하고, 그다음 깊이 및 이진 손실로 다중 프레임 부분을 미세 조정합니다.

실험 결과

연구 질문

RQ1RGB 프레임으로부터의 시간 정보와 추정된 깊이가 정적 단서 이상의 프리젠테이션 어택 탐지에 기여할 수 있는가?
RQ2OFFB(짧은-기간 모션)와 ConvGRU(긴-기간 모션)가 깊이 감독 하에서 PAD 성능에 기여하는 바는 무엇인가?
RQ3대조적(depth) 손실이 살아 있는 얼굴/위조 구분을 위한 얼굴 깊이 토폴로지 학습을 강화하는가?
RQ4제안된 깊이 감독 다중 프레임 접근법이 표준 PAD 벤치마크에서 기존 방법들과 비교해 어떤 성능을 보이는가?

주요 결과

본 접근법은 네 가지 PAD 벤치마크(OULU-NPU, SiW, CASIA-MFSD, Replay-Attack)에서 최첨단 성능을 달성합니다.
분해 연구를 통해 OFFB와 ConvGRU 모두 단일 프레임 기준보다 정확도를 향상시키며, 이들의 조합이 추가적인 이득을 제공합니다.
대조적(depth) 손실은 순수 유클리드 깊이 감독보다 일반화 능력을 향상시킵니다.
다중 프레임 깊이 맵을 단일 프레임 깊이와 융합할 때 살아 있는 얼굴과 위조를 더 잘 구분하게 되며, 특히 크로스-테스트 설정에서도 성능이 향상됩니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.