Skip to main content
QUICK REVIEW

[論文レビュー] Is Sampling Heuristics Necessary in Training Deep Object Detectors

Joya Chen, Dong Liu|arXiv (Cornell University)|Sep 11, 2019
Advanced Neural Network Applications参考文献 44被引用数 11
ひとこと要約

この論文は、OHEM や Focal Loss などのヒューリスティックなハードまたはソフトサンプリング手法を必要としない、サンプリングフリーな深層オブジェクト検出器の訓練手法を提案する。ガイドドロススケーリング、最適なモデル初期化、および適応的しきい値処理を導入することで、COCO や PASCAL VOC における1段階、2段階、マルチステージ、アンカーフリー検出器において、ハイパーパramータチューニングなしで訓練の安定性が向上し、精度が向上する。

ABSTRACT

In training deep object detectors, the problem of foreground-background imbalance has been addressed by several heuristic methods, such as online hard example mining (OHEM), Focal Loss, and gradient harmonizing mechanism (GHM). These methods either re-sample the training examples (i.e. hard sampling), or re-weight them discriminatively (i.e. soft sampling). In this paper, we challenge the necessity of such hard/soft sampling heuristics in training deep object detectors. First, without hard/soft sampling, we reveal that the scale and the stability of the classification loss greatly influence the final accuracy. Thus, we propose a guided loss scaling technique to control the classification loss during training, without using any hyper-parameter. We also propose to optimally initialize the model to ensure the stability of the classification loss. Moreover, we propose an adaptive thresholding technique to refine predictions during inference. These three ingredients constitute our Sampling-Free mechanism, which is fully data diagnostic and avoids the laborious hyper-parameter search for hard/soft sampling. We verify the effectiveness of our Sampling-Free mechanism in training one-stage, two-stage, multi-stage, and anchor-free object detectors, where our method always achieves higher accuracy on COCO and PASCAL VOC datasets. We also use the Sampling-Free mechanism for instance segmentation to demonstrate its generalization ability. Code is released at: this https URL

研究の動機と目的

  • OHEM や Focal Loss、GHM などのヒューリスティックなサンプリング手法が深層オブジェクト検出器の訓練に必要不可欠であるかどうかを検証すること。
  • サンプリングのヒューリスティクスを排除した場合、分類損失のスケールと安定性が検出精度に与える影響を特定すること。
  • ハイパーパramータチューニングを回避し、訓練の安定性を維持するサンプリングフリーな訓練メカニズムを提案すること。
  • 1段階、2段階、マルチステージ、アンカーフリー検出器を含む多様な検出器アーキテクチャに一般化できることを示すこと。
  • インスタンスセグメンテーションへの応用を拡張し、より広範な適用可能性を検証すること。

提案手法

  • 訓練中に分類損失の大きさを動的に制御するガイドドロススケーリングを提案し、手動でのハイパーパramータチューニングの必要性を排除する。
  • 訓練の初期段階から分類損失の安定性を高める最適なモデル初期化を導入する。
  • ネットワークを変更せずに推論時に適応的しきい値処理を適用し、オブジェクトネス予測を精緻化する。
  • ヒューリスティックなサンプリング戦略に依存せず、内在するデータ統計に依存する完全なデータ診断フレームワークを設計する。
  • ロススケーリング、初期化、推論しきい値処理を統合し、統一されたサンプリングフリー機構を構築する。
  • バックボーンやネックアーキテクチャを変更せずに、エンドツーエンドの訓練安定性と性能向上を確保する。

実験結果

リサーチクエスチョン

  • RQ1深層オブジェクト検出器の訓練において、ヒューリスティックなサンプリングは本当に必要なのか、それともそれを排除しても性能が達成可能なのか。
  • RQ2サンプリングのヒューリスティクスが排除された状況下で、分類損失のスケールと安定性が検出精度にどのように影響するか。
  • RQ3提案手法のサンプリングフリーな訓練メカニズムは、多様なオブジェクト検出器アーキテクチャにわたり最先端の性能を達成できるか。
  • RQ4提案手法はオブジェクト検出を越えて、インスタンスセグメンテーションのような他の密予測タスクにも一般化可能か。
  • RQ5損失重み付けやハード例マイニングにおける膨大なハイパーパramータチューニングの必要性を排除できるか。

主な発見

  • 提案されたサンプリングフリー機構は、COCO や PASCAL VOC データセットにおいて、ヒューリスティックサンプリングを用いたベースラインモデルを上回る平均検出精度を達成する。
  • ハイパーパramータチューニングを一切必要とせず、1段階、2段階、マルチステージ、アンカーフリー検出器においても精度が向上する。
  • ガイドドロススケーリングは、ハードまたはソフトサンプリングがなくても訓練の安定性を効果的に向上させ、収束性を改善する。
  • 最適な初期化は訓練の不安定性を顕著に低減し、収束を加速する。
  • 推論時の適応的しきい値処理により、オブジェクトネススコアの精緻化が進み、検出性能がさらに向上する。
  • インスタンスセグメンテーションへの応用においても一般化が可能であり、オブジェクト検出を越えた堅牢性と広範な適用可能性を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。