Skip to main content
QUICK REVIEW

[論文レビュー] Face Attention Network: An Effective Face Detector for the Occluded Faces

Jianfeng Wang, Ye Yuan|arXiv (Cornell University)|Nov 20, 2017
Face recognition and analysis参考文献 36被引用数 144
ひとこと要約

FANはアンカーレベルの注意機構と対象データ拡張を導入し、単段階のRetinaNetベース検出器で閉塞された顔検出を改善し、速度を犠牲にすることなくWiderFaceとMAFAで最先端の結果を達成する。

ABSTRACT

The performance of face detection has been largely improved with the development of convolutional neural network. However, the occlusion issue due to mask and sunglasses, is still a challenging problem. The improvement on the recall of these occluded cases usually brings the risk of high false positives. In this paper, we present a novel face detector called Face Attention Network (FAN), which can significantly improve the recall of the face detection problem in the occluded case without compromising the speed. More specifically, we propose a new anchor-level attention, which will highlight the features from the face region. Integrated with our anchor assign strategy and data augmentation techniques, we obtain state-of-art results on public face detection benchmarks like WiderFace and MAFA. The code will be released for reproduction.

研究の動機と目的

  • マスクやサングラスを含む顔検出の遮蔽/覆いを解消する。
  • 偽陽性を増やさずに遮蔽された顔の再現率を向上させる。
  • アンカーレベルの注意を用いた実用的な単段階検出器を提案する。
  • WiderFaceとMAFAのベンチマークで最先端の性能を示す。

提案手法

  • 多段階顔検出のためにFeature Pyramid Networkをバックボーンとする、RetinaNetに着想を得た単段階検出器を使用する。
  • アンカーレベルの注意を導入:各レイヤーの注意マップを正解アンカーで教師付けし、顔領域を強調し非顔領域を抑制する。
  • faces from 16^2 to 406^2 pixels をカバーするため、5つのピラーレベルと2つのアスペクト比(1と1.5)を用いたアンカー割り当て戦略を設計。
  • 注意マップを特徴マップとの内積前に指数演算を通して入力し、文脈を保持するように注意モジュールを学習する。
  • ランダムクロップを含むデータ拡張を適用して、より多くの遮蔽顔を生成し遮蔽の多様性を増やす。
  • 焦点分類損失、平滑L1回帰損失、注意のピクセル単位シグモイド交差エントロピーを組み合わせたマルチタスク損失で最適化する。

実験結果

リサーチクエスチョン

  • RQ1アンカーレベルの注意は偽陽性を増やさずに遮蔽顔の再現率を向上させることができるか?
  • RQ2スケール認識アンカー設計は、遮蔽されたシーンで異なるサイズの顔の検出にどのような影響を与えるか?
  • RQ3遮蔽志向のデータ拡張が検出器の性能に与える影響は?
  • RQ4FANは速度を維持しつつWiderFaceとMAFAデータセットで最先端の結果を達成するか?

主な発見

AP(易)AP(中)AP(難)
0.9460.9360.885
  • FANはWiderFaceのテストセットで最先端のAPを達成:easy 0.946、medium 0.936、hard 0.885。
  • FANはMAFAのマスク付きサブセットの遮蔽顔検出を大幅に改善し、従来の検出器を上回った。
  • アブレーションにより、アンカーレベルの注意とデータ拡張が遮蔽下で特に性能向上に寄与することを示した。
  • 入力サイズを変えても推論速度は速いままで、例えば最小サイズ400でTITAN Xp時に23.8 ms、APは競合的。
  • アンカー設定(スケールカバレッジ)は性能に大きく影響し、FAN設計のアンカーはRetinaNetのベースラインを上回る。
  • 複数の改良(密集アンカー、注意、データ拡張、多段階)を組み合わせたFANは、検証セットでAPを0.953–0.888、テストWiderFaceで0.946–0.885まで、MAFAの遮蔽サブセットでmAP 88.3を達成。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。