QUICK REVIEW

[論文レビュー] Sample and Computation Redistribution for Efficient Face Detection

Jia Guo, Jiankang Deng|arXiv (Cornell University)|May 10, 2021

Face recognition and analysis参考文献 43被引用数 68

ひとこと要約

本論文は Sample Redistribution (SR) と Computation Redistribution (CR) を導入し、VGA解像度の顔検出の効率と精度を向上させ、SCRFDモデルで最先端のトレードオフを達成する。

ABSTRACT

Although tremendous strides have been made in uncontrolled face detection, efficient face detection with a low computation cost as well as high precision remains an open challenge. In this paper, we point out that training data sampling and computation distribution strategies are the keys to efficient and accurate face detection. Motivated by these observations, we introduce two simple but effective methods (1) Sample Redistribution (SR), which augments training samples for the most needed stages, based on the statistics of benchmark datasets; and (2) Computation Redistribution (CR), which reallocates the computation between the backbone, neck and head of the model, based on a meticulously defined search methodology. Extensive experiments conducted on WIDER FACE demonstrate the state-of-the-art efficiency-accuracy trade-off for the proposed \scrfd family across a wide range of compute regimes. In particular, \scrfdf{34} outperforms the best competitor, TinaFace, by $3.86\%$ (AP at hard set) while being more than \emph{3$ imes$ faster} on GPUs with VGA-resolution images. We also release our code to facilitate future research.

研究の動機と目的

制限された計算資源でVGA解像度の効率的な顔検出を動機づける。
SRを提案し、浅い検出器段階の訓練サンプルを増やす。
バックボーン・ネック・ヘッド全体の計算を最適化するための2段階のCR戦略を提案する。
計算量の異なる領域でWIDER FACE上の精度と効率のトレードオフの改善を示す。

提案手法

大きなクロップによって小顔の訓練サンプルを増やすことにより、特にstride-8特徴の学習を促進するための Sample Redistribution (SR) を導入する。
固定FLOP予算に基づくバックボーン・ネック・ヘッドの簡略化された計算探索空間を設計する。
2段階の計算再分配を実行する： (SCRFD 1) バックボーンのみ最適化、(SCRFD 2) バックボーンの指針の下でのバックボーン+ネック+ヘッド最適化。
実証 bootstrap を用いて有望な計算分布を推定し探索空間を削減する。
VGAのみの検証でゼロからモデルを訓練し、WIDER FACE上の最先端検出器と比較する。

実験結果

リサーチクエスチョン

RQ1VGA解像度で小顔の検出を改善するために、訓練データのサンプリングをどのように再分配できるか。
RQ2固定されたFLOP予算の下で、バックボーン・ネック・ヘッド全体の計算をどのように再分配すべきか、精度を最大化するには。
RQ32段階のCR戦略が顔検出器の検出性能と効率に与える影響は何か。

主な発見

SRはstride-8の正例サンプルを大幅に増やし、hard-set APを向上させる（例：ベースラインでhard APが67.32から74.47へ改善）。
2段階のCR（バックボーンのみ、その後完全検出器）は、単一ステップ再割り当てより高いAPをもたらす（例：CR@two-stepは71.37対70.98）。
SCRFD-34GFは最先端の効率–精度を達成し、hardでTinaFaceを3.86 AP上回り、VGA解像度で3倍超の高速性を実現。
SCRFDモデルは、0.5–34 GFの領域で実質的な効率向上を提供し、パラメータ数も有利（例：SCRFD-34GF: 9.80M）。
VGA検証下で、SCRFD-2.5GFははるかに低い計算量 (~2.5 GF) と推論時間で競争力のある精度を達成する。
2つの再分配戦略は相補的で、複数の計算予算にわたって堅牢である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。