Skip to main content
QUICK REVIEW

[論文レビュー] Efficient Teacher: Semi-Supervised Object Detection for YOLOv5

Bowen Xu, Mingtao Chen|ArXiv.org|Feb 15, 2023
Advanced Neural Network Applications被引用数 30
ひとこと要約

Efficient Teacher は Dense Detector ベースラインを導入し、Pseudo Label Assigner と Epoch Adaptor を組み合わせて、YOLOv5 のような one-stage anchor-based detectors に対する拡張可能で高性能な半教師あり物体検出を実現します。

ABSTRACT

Semi-Supervised Object Detection (SSOD) has been successful in improving the performance of both R-CNN series and anchor-free detectors. However, one-stage anchor-based detectors lack the structure to generate high-quality or flexible pseudo labels, leading to serious inconsistency problems in SSOD. In this paper, we propose the Efficient Teacher framework for scalable and effective one-stage anchor-based SSOD training, consisting of Dense Detector, Pseudo Label Assigner, and Epoch Adaptor. Dense Detector is a baseline model that extends RetinaNet with dense sampling techniques inspired by YOLOv5. The Efficient Teacher framework introduces a novel pseudo label assignment mechanism, named Pseudo Label Assigner, which makes more refined use of pseudo labels from Dense Detector. Epoch Adaptor is a method that enables a stable and efficient end-to-end semi-supervised training schedule for Dense Detector. The Pseudo Label Assigner prevents the occurrence of bias caused by a large number of low-quality pseudo labels that may interfere with the Dense Detector during the student-teacher mutual learning mechanism, and the Epoch Adaptor utilizes domain and distribution adaptation to allow Dense Detector to learn globally distributed consistent features, making the training independent of the proportion of labeled data. Our experiments show that the Efficient Teacher framework achieves state-of-the-art results on VOC, COCO-standard, and COCO-additional using fewer FLOPs than previous methods. To the best of our knowledge, this is the first attempt to apply Semi-Supervised Object Detection to YOLOv5.Code is available: https://github.com/AlibabaResearch/efficientteacher

研究の動機と目的

  • one-stageのアンカー型 detectors のためのSSODを動機づけ、pseudo label の一貫性の欠如に対処する。
  • Dense Detector を提案し、dense inputs で YOLOv5 と RetinaNet の性能を橋渡しする。
  • Pseudo Label Assigner を導入し、soft ガイダンスのために pseudo labels を reliable と uncertain に分割する。
  • Epoch Adaptor を開発し、ドメイン適応と分布適応を用いてエンドツーエンドのSSOD学習を効率的に可能にする。
  • VOC、COCO-standard、COCO-additional で最先端の結果を、FLOPs を抑えつつ実証する。

提案手法

  • RetinaNet を拡張して YOLOv5 に着想を得た dense sampling と objectness branch を追加し、Dense Detector を作成する。
  • 高/低閾値を用いて pseudo labels を reliable と uncertain に分類し、uncertain labels に soft loss を適用する形で Pseudo Label Assigner を開発する。
  • L = Ls + λLu とする SSOD ロスを定義し、Ls は labeled data、Lu は unlabeled data で、class、box、objectness の項を用いて計算する。
  • Lu では pseudo-label のスコアとオブジェクトネスに基づく選択的損失を適用し、信頼性の低い pseudo labels を緩和する。
  • Epoch Adaptor を導入し、gradient reversal layer によるドメイン適応と分布適応を組み合わせて、各エポックごとに動的に pseudo-label の閾値を設定する。
  • クラス分布に基づく分布適応閾値 τ1^k, τ2^k を用いて、エポック間でラベル付き/ラベルなしデータのバランスを取る。

実験結果

リサーチクエスチョン

  • RQ1SSOD における one-stage anchor-based detectors で pseudo label の割り当てをどう洗練させられるか?
  • RQ2Dense Detector は従来の RetinaNet ベースラインより pseudo-label の質と SSOD の性能を改善できるか?
  • RQ3未ラベルデータを用いる SSOD で、エポックごとの適応戦略は訓練の安定性と効率を向上させるか?
  • RQ4既存の SSOD 手法と比較して、VOC、COCO-standard、COCO-additional における Efficient Teacher の利得は何か?

主な発見

  • Efficient Teacher は prior methods より少ない FLOPs で VOC、COCO-standard、COCO-additional で最先端の成果を達成する。
  • Dense Detector は RetinaNet より AP50:95 を 5.36 度向上させ、推論 FLOPs を約30%削減する。
  • Pseudo Label Assigner は reliable と uncertain の pseudo labels を分離し、後者に soft loss を適用することで SSOD を大幅に改善する。
  • Epoch Adaptor はドメイン適応と分布適応を備えた訓練を加速し、学習を安定化させ、少ない反復回数でより良い性能を達成する。
  • バックボーンを YOLOv5l に置換し Efficient Teacher の下で訓練すると、計算オーバーヘッドを抑えつつ最終検出性能が向上する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。