[論文レビュー] YOLO-FaceV2: A Scale and Occlusion Aware Face Detector
この論文は、YOLOv5ベースの顔検出器であるYOLO-FaceV2を提案し、受容野強化モジュール、遮蔽対応アテンションネットワーク、適応サンプル重み付け、正規化ワッサースタイン回帰損失を通じて尺度変動と遮蔽を処理し、WiderFaceで最先端の結果を達成します。
In recent years, face detection algorithms based on deep learning have made great progress. These algorithms can be generally divided into two categories, i.e. two-stage detector like Faster R-CNN and one-stage detector like YOLO. Because of the better balance between accuracy and speed, one-stage detectors have been widely used in many applications. In this paper, we propose a real-time face detector based on the one-stage detector YOLOv5, named YOLO-FaceV2. We design a Receptive Field Enhancement module called RFE to enhance receptive field of small face, and use NWD Loss to make up for the sensitivity of IoU to the location deviation of tiny objects. For face occlusion, we present an attention module named SEAM and introduce Repulsion Loss to solve it. Moreover, we use a weight function Slide to solve the imbalance between easy and hard samples and use the information of the effective receptive field to design the anchor. The experimental results on WiderFace dataset show that our face detector outperforms YOLO and its variants can be find in all easy, medium and hard subsets. Source code in https://github.com/Krasjet-Yu/YOLO-FaceV2
研究の動機と目的
- 大規模尺度変動、遮蔽、容易/難データの不均衡の課題に対処する。
- 小顔検出を強化したYOLOv5ベースのリアルタイムOne-stage顔検出器を開発する。
- 遮蔽処理、尺度認識、回帰の頑健性を向上させるモジュールを導入する。
- WiderFaceで評価し、最先端の顔検出器と比較する。
提案手法
- P5層で拡張畳み込みを用いて受容野を拡大・多様化する受容野強化(RFE)を導入する。
- SEAM、遮蔽対応のマルチヘッドアテンションモジュールを提案し、遮蔽された顔特徴を回復する。
- IoU統計に基づいて難例と容易例の重みを適応的に調整するSlide損失を設計する。
- 効果的な受容野に guided されたアンカード設計を採用し、顔のスケールにより適合させる。
- 回帰補助としてIoUと併用する正規化ワッサースタイン距離(NWD)を組み込み、小顔定位を改善する。
実験結果
リサーチクエスチョン
- RQ1マルチスケール融合と拡張された受容野は、大顔の性能を犠牲にせず小顔検出を改善できるのか。
- RQ2SEAMは遮蔽による特徴損失を効果的に緩和し、遮蔽下でのリコールを改善できるのか。
- RQ3適応的サンプル重み付け(Slide)と効果的な受容野に guided されたアンカー設計は、容易/難サンプルの不均衡を解消できるのか。
- RQ4NWDをIoUと組み合わせることで、小顔の回帰頑健性を高めつつ大顔の性能を維持できるのか。
主な発見
| Method | Easy | Medium | Hard |
|---|---|---|---|
| YOLO-FaceV2 | 0.987 | 0.972 | 0.877 |
- YOLO-FaceV2はWiderFace検証でEasy、Medium、Hardがそれぞれ0.987、0.972、0.877を達成。
- SEAMの導入により、Easyが0.88、Mediumが0.82、Hardが1.06の改善をWiderFace検証サブセットで達成。
- P2をPANに統合しRFEを拡張畳み込みと共に適用するとHardの精度が2.17ポイント向上(サブセット間で相対的な gains)。
- 効果的受容野に guided されたアンカー設計は、特にHardで顕著な改善(0.9ポイントの改善)をもたらした。
- NWD損失単独ではIoUを上回らなかったが、NWDとIoUを組み合わせると小顔の頑健性が向上した。
- Repulsion Loss(RepGT/RepBox)はEasy、Medium、Hardをそれぞれ0.71、0.63、0.50改善。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。