Skip to main content
QUICK REVIEW

[論文レビュー] PyramidBox++: High Performance Detector for Finding Tiny Face

Zhihang Li, Xu Tang|arXiv (Cornell University)|Mar 31, 2019
Face recognition and analysis参考文献 44被引用数 37
ひとこと要約

PyramidBox++は、WIDER FACEにおける超小顔検出を、バランスの取れたデータサンプリング、デュアルピラミッドアンカー、密なコンテキストモジュール、マルチタスク学習を用いて強化し、Hardセットで最先端の結果を達成します。

ABSTRACT

With the rapid development of deep convolutional neural network, face detection has made great progress in recent years. WIDER FACE dataset, as a main benchmark, contributes greatly to this area. A large amount of methods have been put forward where PyramidBox designs an effective data augmentation strategy (Data-anchor-sampling) and context-based module for face detector. In this report, we improve each part to further boost the performance, including Balanced-data-anchor-sampling, Dual-PyramidAnchors and Dense Context Module. Specifically, Balanced-data-anchor-sampling obtains more uniform sampling of faces with different sizes. Dual-PyramidAnchors facilitate feature learning by introducing progressive anchor loss. Dense Context Module with dense connection not only enlarges receptive filed, but also passes information efficiently. Integrating these techniques, PyramidBox++ is constructed and achieves state-of-the-art performance in hard set.

研究の動機と目的

  • 制約のある環境で大きなスケール変動と超小顔を伴う堅牢な顔検出を動機づける。
  • データサンプリングの不均衡とコンテキスト利用を解決してPyramidBoxを改善する。
  • 追加の監視と正則化を提供するためにマルチタスク学習を活用する。

提案手法

  • Balanced-data-anchor-sampling (BDAS)を導入して均等な顔スケールサンプリングを実現する。
  • Dual-PyramidAnchorsを提案してバックボーン近傍の段階的な文脈監視を可能にする。
  • 密な接続を持つDense Context Moduleを組み込んで受容野を拡大し情報フローを改善する。
  • セグメンテーションとアンカーなし検出を含むマルチタスク学習を採用して追加の監督を提供する。

実験結果

リサーチクエスチョン

  • RQ1顔スケール間のサンプリングのバランスはWIDER FACEで超小顔のリコールを改善できるか。
  • RQ2デュアルピラミッドアンカーと密なコンテキストを組み込むことで、従来のPyramidBoxと比較して小顔の定位は改善されるか。
  • RQ3セグメンテーションとアンカーなしタスクは超小顔の検出性能全体にどのような影響を与えるか。

主な発見

  • WIDER FACEで、PyramidBox++は検証時にAPが96.5%(Easy)、95.9%(Medium)、91.2%(Hard)、テスト時に95.6%(Easy)、95.2%(Medium)、90.9%(Hard)を達成。
  • 本手法はHardサブセットのすべての手法を上回り、超小顔検出性能の高さを示している。
  • BDASは顔スケールのサンプリングをより均一にし、小顔リコールを改善する。
  • Dense Context ModuleとDual-PyramidAnchorsは、追加のランタイムコストなしにバックボーン近傍の特徴学習を改善する。
  • セグメンテーションとアンカーなしブランチを含むマルチタスク学習は、検出性能を高める追加の監督を提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。