[論文レビュー] Searching Central Difference Convolutional Networks for Face Anti-Spoofing
Central Difference Convolution (CDC) とその CNNs (CDCN/CDCN++) をフレームレベルの顔盗用防止に導入し、バックボーンを NAS で探索し、Multiscale Attention Fusion Module を用いる。六つのベンチマークで intra-および cross-dataset の最先端を達成。
Face anti-spoofing (FAS) plays a vital role in face recognition systems. Most state-of-the-art FAS methods 1) rely on stacked convolutions and expert-designed network, which is weak in describing detailed fine-grained information and easily being ineffective when the environment varies (e.g., different illumination), and 2) prefer to use long sequence as input to extract dynamic features, making them difficult to deploy into scenarios which need quick response. Here we propose a novel frame level FAS method based on Central Difference Convolution (CDC), which is able to capture intrinsic detailed patterns via aggregating both intensity and gradient information. A network built with CDC, called the Central Difference Convolutional Network (CDCN), is able to provide more robust modeling capacity than its counterpart built with vanilla convolution. Furthermore, over a specifically designed CDC search space, Neural Architecture Search (NAS) is utilized to discover a more powerful network structure (CDCN++), which can be assembled with Multiscale Attention Fusion Module (MAFM) for further boosting performance. Comprehensive experiments are performed on six benchmark datasets to show that 1) the proposed method not only achieves superior performance on intra-dataset testing (especially 0.2% ACER in Protocol-1 of OULU-NPU dataset), 2) it also generalizes well on cross-dataset testing (particularly 6.5% HTER from CASIA-MFSD to Replay-Attack datasets). The codes are available at \href{https://github.com/ZitongYu/CDCN}{https://github.com/ZitongYu/CDCN}.
研究の動機と目的
- 照度や環境変化に影響されにくい頑健なフレームレベルの顔盗用防止を動機づける。
- 追加パラメータなしで、強度情報と勾配情報の両方を捉える Central Difference Convolution (CDC) を導入する。
- NAS 探索済みのバックボーンと Multiscale Attention Fusion Module (MAFM) を備えた CDCN および CDCN++ を開発して性能を向上させる。
- 6 データセットにまたがる intra- および cross-dataset FAS ベンチマークで最先端の性能を示す。
提案手法
- CDC を、theta によって制御される従来の畳み込みと中心微分勾配項の重み付きブレンドとして定義し、追加パラメータなしでより豊かなディテールを捉える。
- 深度監視型 FAS バックボーンに従来の畳み込みを CDC に置換して CDCN を形成し、L_MSE および L_CDL 損失で深度マップ予測を最適化する。
- NAS ベースのバックボーン探索を、低/中/高の多段セルをまたぐ探索とノード注意機構を組み込んだ CDCN++ を提案してアーキテクチャ選択を行う。
- 空間注意を伴う多段 CDC 特徴を refine し f する Multiscale Attention Fusion Module (MAFM) を統合して判別性を向上させる。
- bi-level 最適化フレームワークで NAS ベースのバックボーン探索を実施し、その後離散的なアーキテクチャ導出と性能評価を行う。
実験結果
リサーチクエスチョン
- RQ1Central Difference Convolution (CDC) は、さまざまな条件下で微細な不変特徴を捉えることにより、フレームレベルの顔盗用防止を改善できるか。
- RQ2NAS ベースのバックボーン探索と CDCN++ および MAFFM の組み合わせは、データセット内およびデータセット間の FAS 性能を向上させるか。
- RQ3さまざまな θ 値と CDC のバリアントは FAS 性能にどのような影響を及ぼすか。
- RQ4CDC N / CCDC+ は、既存手法と比較して、クロス種別およびクロスデータセットの spoofing 攻撃へどの程度一般化するか。
主な発見
| Prot. | Method | APCER(%) | BPCER(%) | ACER(%) |
|---|---|---|---|---|
| 1 | GRADIANT | 1.3 | 12.5 | 6.9 |
| 1 | STASN | 1.2 | 2.5 | 1.9 |
| 1 | Auxiliary | 1.6 | 1.6 | 1.6 |
| 1 | FAS-TD | 2.5 | 0.0 | 1.3 |
| 1 | DeepPixBiS | 0.8 | 0.0 | 0.4 |
| 1 | CDCN | 0.4 | 1.7 | 1.0 |
| 1 | CDCN++ | 0.4 | 0.0 | 0.2 |
- CDC は従来の畳み込みや他のバリアントより優れており、最良の結果は θ = 0.7 のとき得られる。
- CDC ベースのネットワーク(CDCN)は、OULU-NPU Protocol-1 での intra-dataset で最先端の性能を達成(ACER は CDCN で 1.0% 以下、SiW での ACER は CDCN++ が 0.12%)。
- NAS ベースのバックボーンと MAFFM を備えた CDCN++ は、すべての OULU-NPU プ Protocols で intra-dataset 結果が優秀で、クロスデータセットの向上も顕著(例:CASIA-MFSD から Replay-Attack への HTER が 6.5%)。
- クロスデータセット評価では CDCN++ は CR/RC プロトコルで最良-known 結果に匹敵(例:CR で 6.5% HTER;RC で 29.8% の HTER、報告設定)。
- MAFM および多段セル NAS バックボーンは、プロトコルとデータセット全体で ACER の改善に寄与し、学習済みの多段・注意誘導型融合の有益性を示している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。