Skip to main content
QUICK REVIEW

[論文レビュー] TinaFace: Strong but Simple Baseline for Face Detection

Yanjia Zhu, Hongxiang Cai|arXiv (Cornell University)|Nov 26, 2020
Advanced Neural Network Applications参考文献 62被引用数 68
ひとこと要約

TinaFace は顔検出を one-class generic object detection 問題として扱い、RetinaNet ベースの強力でシンプルな one-stage ベースラインで WIDER FACE における最先端の結果を達成します。hard では 92.1% AP、test-time augmentation で 92.4% AP に到達します。

ABSTRACT

Face detection has received intensive attention in recent years. Many works present lots of special methods for face detection from different perspectives like model architecture, data augmentation, label assignment and etc., which make the overall algorithm and system become more and more complex. In this paper, we point out that extbf{there is no gap between face detection and generic object detection}. Then we provide a strong but simple baseline method to deal with face detection named TinaFace. We use ResNet-50 \cite{he2016deep} as backbone, and all modules and techniques in TinaFace are constructed on existing modules, easily implemented and based on generic object detection. On the hard test set of the most popular and challenging face detection benchmark WIDER FACE \cite{yang2016wider}, with single-model and single-scale, our TinaFace achieves 92.1\% average precision (AP), which exceeds most of the recent face detectors with larger backbone. And after using test time augmentation (TTA), our TinaFace outperforms the current state-of-the-art method and achieves 92.4\% AP. The code will be available at \url{https://github.com/Media-Smart/vedadet}.

研究の動機と目的

  • 顔検出を効果的に one-class generic object detection 問題として捉えられることを示す。
  • 標準的な検出モジュールに基づく、強力でシンプルなベースライン(TinaFace)を提供する。
  • ResNet-50 バックボーンを用いた WIDER FACE hard サブセットで TinaFace が最先端または競争力のある結果を達成することを示す。

提案手法

  • 共通で公正なベースラインとして、6 レベルの FPN バックボーンを備えた ResNet-50 を使用する。
  • マルチスケール特徴を強化するために Inception モジュールを組み込む。
  • 信頼度の再重み付けのためにボックス IoU を予測する IoU-aware ヘッドを追加する。
  • 小さな物体をよりうまく扱うために bounding-box 回帰には DIoU ロスを使用する。
  • 小さなバッチサイズでの安定した学習のため BatchNorm を GroupNorm に置換する。
  • パフォーマンスを向上させるために、任意でテスト時拡張(TTA)を採用する。

実験結果

リサーチクエスチョン

  • RQ1専門的な顔専用コンポーネントなしで、標準的な汎用物体検出技術を用いて顔検出を効果的に解決できるか?
  • RQ2単純で単一スケール・単一モデルのパイプラインを用いて、WIDER FACE hard サブセットでどの程度の性能が得られるか?
  • RQ3IoU-aware と distance-IoU ロスを組み込むと、特に小さな顔に対して局所化と全体の AP が改善されるか?

主な発見

  • 単一スケール・単一モデルの設定と ResNet-50 バックボーンで、TinaFace は WIDER FACE の hard サブセットで 92.1% AP を達成。
  • テスト時拡張を用いると、hard サブセットで 92.4% AP を達成し、現状の最先端手法を上回る。
  • 汎用検出モジュールに基づく強力なベースラインは、より大きなバックボーンを用いる多くの最近の顔検 detector を上回ることができる。
  • DIoU ロスと IoU-aware ヘッドは、局所化の改善と小さな顔の誤検知の削減に寄与する。
  • 小さなバッチ条件下での学習を安定化させるため BatchNorm を GroupNorm に置換する。
  • 表の結果は、検証データで ResNet-50(no-TTA)で TinaFace が 0.963 Easy, 0.957 Medium, 0.930 Hard を達成し、テストデータでは 0.952 Easy, 0.947 Medium, 0.921 Hard を達成していることを示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。