Skip to main content
QUICK REVIEW

[論文レビュー] A Simple Semi-Supervised Learning Framework for Object Detection

Kihyuk Sohn, Zizhao Zhang|arXiv (Cornell University)|May 10, 2020
Advanced Neural Network Applications参考文献 69被引用数 325
ひとこと要約

STACは、ラベルなしデータから高信頼の疑似境界ボックスを生成する教師を使用し、強力な拡張を用いて訓練する2段階のシンプルな半教師付きフレームワークを導入し、MS-COCOとVOC07でデータ効率を大幅に改善します。

ABSTRACT

Semi-supervised learning (SSL) has a potential to improve the predictive performance of machine learning models using unlabeled data. Although there has been remarkable recent progress, the scope of demonstration in SSL has mainly been on image classification tasks. In this paper, we propose STAC, a simple yet effective SSL framework for visual object detection along with a data augmentation strategy. STAC deploys highly confident pseudo labels of localized objects from an unlabeled image and updates the model by enforcing consistency via strong augmentations. We propose experimental protocols to evaluate the performance of semi-supervised object detection using MS-COCO and show the efficacy of STAC on both MS-COCO and VOC07. On VOC07, STAC improves the AP$^{0.5}$ from $76.30$ to $79.08$; on MS-COCO, STAC demonstrates $2{\times}$ higher data efficiency by achieving 24.38 mAP using only 5\% labeled data than supervised baseline that marks 23.86\% using 10\% labeled data. The code is available at https://github.com/google-research/ssl_detection/.

研究の動機と目的

  • ラベリングコストの高さにより、ラベル効率の良い物体検出を動機づける。
  • 疑似ラベリングと拡張の一貫性を活用したシンプルなSSLフレームワークを開発する。
  • 低ラベル条件下でのSTACのMS-COCOおよびPASCAL VOCにおける有効性を示す。

提案手法

  • Noisy-Studentに触発された2段階の訓練: labeledデータで教師を訓練し、次に unlabeled 画像の疑似ボックスを生成する。
  • 高い信頼度閾値を用いて疑似ボックスをフィルタし、テスト時推論を行って疑似ラベルを得る。
  • 未ラベルデータに対してグローバルカラー、グローバルジオメトリ、ボックスレベル変換、Cutoutなどの強力で多様なデータ拡張を適用し、疑似ボックスをそれに応じて調整する。
  • 強力な拡張後の疑似ラベルに関する教師なし損失を計算し、ラベル付きデータの教師あり損失と結合する。
  • 単純な教師なし損失重み lambda_u と信頼度閾値 tau(tau ≈ 0.9、lambda_u ≈ 2)を用いてFaster R-CNNを最適化する。
  • MS-COCOとPASCAL VOCを1–10%のラベルデータと全データで評価し、教師ありベースラインと比較する。

実験結果

リサーチクエスチョン

  • RQ1疑似ラベリングと強力な拡張を用いたシンプルなSSLフレームワークは、限られたラベルデータで物体検出を改善できるか?
  • RQ2疑似ラベルの品質、拡張の強さ、未ラベルデータの規模がMS-COCOとVOC07の検出性能にどう影響するか?
  • RQ3低ラベル領域でのSTACの効果的なハイパーパラメータ(tau,lambda_u)は何か?

主な発見

Methods1% COCO2% COCO5% COCO10% COCO100% COCO
Supervised9.05 ± 0.1612.70 ± 0.1518.47 ± 0.2223.86 ± 0.8137.63
Supervised †9.83 ± 0.2314.28 ± 0.2221.18 ± 0.2026.18 ± 0.1239.48
STAC13.97 ± 0.3518.25 ± 0.2524.38 ± 0.1228.64 ± 0.2139.21
  • STACはMS-COCOで1–10%ラベルデータの範囲で一貫して教師なしベースラインを上回る。
  • 5%のラベルデータで、STACはmAPを18.47(教師あり)から24.38へ改善; 10%では23.86から28.64へ改善。
  • STACは100% COCOで39.21 mAPを達成(教師ありベースライン37.63および強力な拡張で39.48に対して)。
  • VOC07では、追加の未ラベルデータを用いたSTACは46.01 mAP(AP50 79.08)に達し、教師ありベースラインの42.60/76.30に対して。
  • STACのデータ効率は低ラベル領域で約2倍であり、特に5%および10%のラベルデータで顕著で、より大きな未ラベルデータプールの恩恵を受ける。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。