QUICK REVIEW

[논문 리뷰] Searching Central Difference Convolutional Networks for Face Anti-Spoofing

Zitong Yu, Chenxu Zhao|arXiv (Cornell University)|2020. 03. 09.

Biometric Identification and Security참고 문헌 64인용 수 38

한 줄 요약

Central Difference Convolution (CDC)와 CNN들(CDCN/CDCN++)을 프레임 단위 얼굴 위조 탐지에 도입하고, 백본 탐색에 NAS를 사용하며 Multiscale Attention Fusion Module를 도입한다; 여섯 개 벤치마크에서 내부 및 교차 데이터셋에서 최첨단 성능을 달성한다.

ABSTRACT

Face anti-spoofing (FAS) plays a vital role in face recognition systems. Most state-of-the-art FAS methods 1) rely on stacked convolutions and expert-designed network, which is weak in describing detailed fine-grained information and easily being ineffective when the environment varies (e.g., different illumination), and 2) prefer to use long sequence as input to extract dynamic features, making them difficult to deploy into scenarios which need quick response. Here we propose a novel frame level FAS method based on Central Difference Convolution (CDC), which is able to capture intrinsic detailed patterns via aggregating both intensity and gradient information. A network built with CDC, called the Central Difference Convolutional Network (CDCN), is able to provide more robust modeling capacity than its counterpart built with vanilla convolution. Furthermore, over a specifically designed CDC search space, Neural Architecture Search (NAS) is utilized to discover a more powerful network structure (CDCN++), which can be assembled with Multiscale Attention Fusion Module (MAFM) for further boosting performance. Comprehensive experiments are performed on six benchmark datasets to show that 1) the proposed method not only achieves superior performance on intra-dataset testing (especially 0.2% ACER in Protocol-1 of OULU-NPU dataset), 2) it also generalizes well on cross-dataset testing (particularly 6.5% HTER from CASIA-MFSD to Replay-Attack datasets). The codes are available at \href{https://github.com/ZitongYu/CDCN}{https://github.com/ZitongYu/CDCN}.

연구 동기 및 목표

조명 및 환경 변화에 덜 민감한 강건한 프레임 수준 얼굴 위조 탐지를 동기화합니다.
CDC를 도입하여 추가 파라미터 없이 강력한 강도 정보와 기울기 정보를 포착합니다.
NAS로 탐색된 백본과 Multiscale Attention Fusion Module (MAFM)으로 CDCN 및 CDCN++를 개발하여 성능을 향상시킵니다.
여섯 개 데이터셋에 걸친 내부 및 교차 데이터셋 FAS 벤치마드에서 최첨단 성능을 입증합니다.

제안 방법

CDC를 vanilla 합성곱과 중심 차이 기 gradient 항의 가중 혼합으로 정의하고, theta로 제어하여 추가 파라미터 없이 더 풍부한 디테일을 포착할 수 있습니다.
depth-map 예측을 L_MSE와 L_CDL 손실로 최적화하여 CDCN을 형성하기 위해 깊이 감독 FAS 백본에서 vanilla 합성곱을 CDC로 대체합니다.
NAS 기반 백본 검색을 다양한 다층 셀(저/중/고)을 대상으로 도입하고 Node Attention 메커니즘을 통한 구조 선택으로 CDCN++를 제안합니다.
Multiscale Attention Fusion Module (MAFM)을 통합하여 다중 수준 CDC 특성을 공간 주의와 함께 정제·융합하여 판별력을 향상합니다.
바이레벨 최적화 프레임워크에서 NAS 기반 백본 검색을 수행하고, 이산적인 아키텍처 도출 및 성능 평가를 수행합니다.]

실험 결과

연구 질문

RQ1Central Difference Convolution (CDC)가 다양한 조건에서 미세한 불변 특성을 포착하여 프레임 수준 얼굴 위조 탐지를 개선할 수 있는가?
RQ2NAS 기반 백본 검색과 CDCN++ 및 MAFM의 조합이 데이터셋 내외에서 우수한 FAS 성능을 제공하는가?
RQ3다양한 theta 값 및 CDC 변형이 FAS 성능에 미치는 영향은 무엇인가?
RQ4CDC N/CCDC+가 기존 방법과 비교하여 교차 유형 및 교차 데이터셋 위조 공격에 일반화되는 방식은 무엇인가?

주요 결과

프로토콜	방법	APCER(%)	BPCER(%)	ACER(%)
1	GRADIANT	1.3	12.5	6.9
1	STASN	1.2	2.5	1.9
1	Auxiliary	1.6	1.6	1.6
1	FAS-TD	2.5	0.0	1.3
1	DeepPixBiS	0.8	0.0	0.4
1	CDCN	0.4	1.7	1.0
1	CDCN++	0.4	0.0	0.2

CDC는 vanilla 합성곱 및 다른 변형들보다 우수하며, theta = 0.7일 때 최상의 성능을 달성합니다.
CDC 기반 네트워크(CDCN)는 OULU-NPU Protocol-1에서 내부 데이터셋 최첨단 성능을 달성하며(ACER가 CDCN에서 1.0%까지 낮은 경우 포함) SiW에서도 프로토콜에서 ACER 0.12%로 최상위에 도달합니다.
NAS 기반 백본과 MAFM을 갖춘 CDCN++은 모든 OULU-NPU 프로토콜에서 내부 데이터셋 결과가 우수하고 교차 데이터셋에서 강한 이득을 제공합니다(예: CASIA-MFSD에서 Replay-Attack으로의 6.5% HTER 상승 등).
교차 데이터셋 테스트에서 CDCN++은 CR/RC 프로토콜에서 최고로 알려진 결과에 근접하거나 경쟁력을 보이며(예: CR에서 6.5% HTER; RC에서 29.8%로 보고된 설정).
MAFM 및 다양한 셀 NAS 백본은 프로토콜 및 데이터셋 전반에 걸쳐 ACER를 개선하는 데 기여하여 학습된 다층, 주의 집중 가이드를 통한 융합의 이점을 보여줍니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.