Skip to main content
QUICK REVIEW

[論文レビュー] Detecting Faces Using Region-based Fully Convolutional Networks

Yitong Wang, Xing Ji|arXiv (Cornell University)|Sep 14, 2017
Face recognition and analysis参考文献 15被引用数 94
ひとこと要約

Face R-FCN は、位置信号付きプーリング、マルチスケールの訓練/テスト、およびオンライン・ハード・エグザンプル・マイニングを用いた region-based fully convolutional network で顔を検出し、WIDER FACE と FDDB で最先端の結果を達成します。

ABSTRACT

Face detection has achieved great success using the region-based methods. In this report, we propose a region-based face detector applying deep networks in a fully convolutional fashion, named Face R-FCN. Based on Region-based Fully Convolutional Networks (R-FCN), our face detector is more accurate and computational efficient compared with the previous R-CNN based face detectors. In our approach, we adopt the fully convolutional Residual Network (ResNet) as the backbone network. Particularly, We exploit several new techniques including position-sensitive average pooling, multi-scale training and testing and on-line hard example mining strategy to improve the detection accuracy. Over two most popular and challenging face detection benchmarks, FDDB and WIDER FACE, Face R-FCN achieves superior performance over state-of-the-arts.

研究の動機と目的

  • 区域ベースの完全畳み込みネットワークを用いて、正確かつ効率的な顔検出を実現する。
  • tiny な顔や多様な顔を扱うために、R-FCN フレームワークに顔特有の設計を取り入れる。
  • 位置信号付きプーリングとスケール戦略を通じて特徴表現を強化する。
  • マルチスケールデータとハードエグザンプルマイニングで訓練を改善し、難易度の高い顔の検出を向上させる。

提案手法

  • ResNet バックボーンを持つ R-FCN を用いて共有計算を実現する。
  • 小さなアンカーと RoI プーリングサイズを導入し、tiny な顔の検出を改善する。
  • 顔領域の寄与を再重み付けするために、位置信号付き平均プーリングを適用する。
  • 後段の畳み込みで atrous 研究を用い、文脈と解像度を保持する。
  • 画像ピラミッドを用いたマルチスケールの訓練とテストおよびオンライン・ハード・エグザンプル・マイニング(OHEM)を適用する。
  • テスト時にスケール間で結果をアンサンブルし、精度を向上させる。

実験結果

リサーチクエスチョン

  • RQ1Region-based Fully Convolutional Network を、スケールや遮蔽( occlusion )下で頑健な顔検出へ適合させることはできるか。
  • RQ2位置信号付きプーリングと小さな RoI は、小さな顔や部分的に遮蔽された顔の検出を改善するか。
  • RQ3マルチスケール訓練/テストと OHEM が、難易度の高いベンチマークでの顔検出精度へ与える影響は何か。

主な発見

  • Face R-FCN は、WIDER FACE の Easy、Medium、Hard の各サブセットで従来手法を上回る性能を達成した。
  • Face R-FCN は、FDDB において制限のない訓練プロトコル下で最先端の結果を達成し、指定された False Positive 数に対して高い True Positive 率を示す。
  • 位置信号付き平均プーリングを組み込むと、全体平均プーリングと比較して埋め込みの識別性が向上する。
  • マルチスケール戦略と OHEM は、特に tiny な顔の検出を含む訓練効率と難例の検出を改善する。
  • 画像ピラミッド(マルチスケール)でのテストは、スケールを跨る頑健な検出をもたらす。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。