QUICK REVIEW

[論文レビュー] Exploiting temporal and depth information for multi-frame face anti-spoofing

Zezheng Wang, Chenxu Zhao|arXiv (Cornell University)|Nov 13, 2018

Biometric Identification and Security参考文献 32被引用数 77

ひとこと要約

この論文は、短期および長期の動きの手がかり（OFFBとConvGRU）と対比的深度損失を組み合わせた深度監督付きの多-frame 顔面偽造検出フレームワークを紹介し、4つのベンチマークで最先端の結果を達成します。

ABSTRACT

Face anti-spoofing is significant to the security of face recognition systems. Previous works on depth supervised learning have proved the effectiveness for face anti-spoofing. Nevertheless, they only considered the depth as an auxiliary supervision in the single frame. Different from these methods, we develop a new method to estimate depth information from multiple RGB frames and propose a depth-supervised architecture which can efficiently encodes spatiotemporal information for presentation attack detection. It includes two novel modules: optical flow guided feature block (OFFB) and convolution gated recurrent units (ConvGRU) module, which are designed to extract short-term and long-term motion to discriminate living and spoofing faces. Extensive experiments demonstrate that the proposed approach achieves state-of-the-art results on four benchmark datasets, namely OULU-NPU, SiW, CASIA-MFSD, and Replay-Attack.

研究の動機と目的

時間的深さが生体と偽装顔の識別に果たす役割を分析する。
RGBフレームからの時間情報を活用する深度監督アーキテクチャを開発する。
PADのための短期および長期の動きを捉えるメカニズムを導入する（OFFBとConvGRU）。
深度監督の下で顔のTopographyを学習する対比的深度損失を提案する。
標準的なPADベンチマークで優れた性能を示す。

提案手法

単眼RGBフレームから深度を推定する深度監督ネットワークを用いる。
絶対深度損失と対比的深度損失を用いた単一 frame の深度回帰を用いる。
光学フロー誘導特徴ブロック（OFFB）で短期動作を抽出する。
畳み込み型ゲート付きリカレントユニット（ConvGRU）で長期動作を捉える。
単一フレームと多フレームの深度マップを残差風の融合で統合して D_fusion を得る。
二段階の学習戦略で訓練する：まず単一フレーム部分を固定し、次に深度とバイナリ損失で多フレーム部分を微調整する。

実験結果

リサーチクエスチョン

RQ1RGBフレームから推定される深度と時間情報は、静的な手がかりを超えてプレゼンテーション攻撃検出を改善できるか。
RQ2深度監督下でOFFB（短期動作）とConvGRU（長期動作）を組み込むことはPAD性能にどのように寄与するか。
RQ3対比的深度損失を取り入れることで、ライブ/偽装識別のための顔の深度トポロジーの学習が向上するか。
RQ4提案された深度監督付き多-frameアプローチは、従来法と比べて標準的なPADベンチマークでどのような性能を示すか。

主な発見

このアプローチは4つのPADベンチマーク（OULU-NPU、SiW、CASIA-MFSD、Replay-Attack）で最先端の結果を達成する。
アブレーション研究により、OFFBとConvGRUの両方が単一フレームのベースラインより精度を向上させ、その組み合わせがさらなる利得を提供することが示される。
対比的深度損失は、ユークリッド深度監督のみの場合より一般化性能を改善する。
多フレーム深度マップを単一フレーム深度と融合することで、生体/偽装の識別性能が向上し、特に困難なクロス-testing設定においても改善が見られる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。