QUICK REVIEW

[論文レビュー] Reduced Focal Loss: 1st Place Solution to xView object detection in Satellite Imagery

Nikolay Sergievskiy, Alexander Ponamarev|arXiv (Cornell University)|Mar 4, 2019

Advanced Neural Network Applications参考文献 4被引用数 26

ひとこと要約

本論文は、ハードサンプルおよび誤ラベル付きサンプルへの注目を緩和しながらも、ハードサンプルマインニングを維持する新しい損失関数、Reduced Focal Loss (RFL) を導入する。RFL はレアクラスの再現率を向上させ、テスト時増強を用いたモデルアンサンブルにより、xView 2018 ディテクションチャレンジで 31.74 mAP（パブリックリーダーボード）および 29.32 mAP（プライベートリーダーボード）を達成し、1位を獲得した。

ABSTRACT

This paper describes our approach to the DIUx xView 2018 Detection Challenge [1]. This challenge focuses on a new satellite imagery dataset. The dataset contains 60 object classes that are highly imbalanced. Due to the imbalanced nature of the dataset, the training process becomes significantly more challenging. To address this problem, we introduce a novel Reduced Focal Loss function, which brought us 1st place in the DIUx xView 2018 Detection Challenge.

研究の動機と目的

レアクラス（例：レールウェイ・ビークル、100件）が共通クラス（例：スモールカー、20万件以上）に比べて著しく少ない、xView 衛星画像データセットにおける極端なクラス不均衡を解消すること。
標準的なフォーカルロスが、ハードサンプルへの過剰な注目により、2段階検出器の設計意図を損なう RPN の再現率を低下させるという限界を克服すること。
ハードサンプルマインニングを維持しながら、誤ラベル付きやハードなサンプルへの感受性を低減する損失関数を開発し、稀なクラスの性能を向上させること。
頻度の高いクラスのランダムアンダーサンプリングによるデータレベルの正則化と、変更された損失関数を組み合わせることで、稀なクラスの汎化性能と mAP を向上させること。

提案手法

ハードサンプルおよび誤ラベル付きサンプルへの過剰な影響を軽減するため、フォーカルロスの変種として Reduced Focal Loss (RFL) を提案。正例の確信度が閾値未満（例：RPN では 0.5、Fast R-CNN では 0.25）の場合、損失勾配を低下させる閾値ベースのカットオフ要因を適用する。
pt < th の場合、損失はスケーリングされず 1 のままにし、pt ≥ th の場合、損失は (1-pt)^γ / th^γ でスケーリングされる。これにより、低信頼度予測の損失が緩和される。
pt < 0.5 の低損失領域で、フォーカルロスとクロスエントロピーの内蔵スイッチを導入。これにより、稀なまたは誤ラベル付きのサンプルによる極端な影響を低減しつつ、適切に分類された例の抑制を維持できる。
頻度の高いクラス（スモールカーおよび建物）のトレーニング中にランダムアンダーサンプリングを実施し、クラス不均衡をさらに軽減。このクラスのサンプル削除確率は設定可能である。
2段階トレーニングプロセスを用いて、FPN と ResNet-50 バックボーンを搭載した Faster R-CNN モデルを訓練：最初に学習率減衰を伴う 24 時間の初期トレーニングを行い、その後、トレイン＋バリデーションデータを統合してファインチューニングを行う。
テスト時増強とモデルアンサンブルを用い、複数のモデル（例：異なるスケール、回転、アーキテクチャ）間で修正された投票戦略を適用することで、最終的な性能を向上させる。

実験結果

リサーチクエスチョン

RQ1高度に不均衡な衛星画像に標準フォーカルロスを適用した場合、2段階オブジェクト検出器における RPN の再現率にどのような影響を与えるか？
RQ2ハードサンプルおよび誤ラベル付きサンプルの負の影響を軽減しつつ、ハードサンプルマインニングを維持できるように変更された損失関数は、性能にどのように寄与するか？
RQ3頻度の高いクラスのランダムアンダーサンプリングは、衛星画像におけるオブジェクト検出のレアクラスの mAP をどの程度向上させ得るか？
RQ4Reduced Focal Loss とデータレベルの正則化（アンダーサンプリング）を組み合わせることで、単体の手法よりも優れた性能が得られるか？
RQ5テスト時増強を用いたモデルアンサンブルは、xView データセットにおける個々のモデルの性能を上回る mAP を達成できるか？

主な発見

Reduced Focal Loss を用いたモデルは、バリデーションセットで 28.32 mAP を達成。標準フォーカルロス（19.01 mAP）およびベースライン SSD（21.78 mAP）を大きく上回った。
RFL を用いたモデルは、パブリックリーダーボードで 31.74 mAP、プライベートリーダーボードで 29.32 mAP を達成し、xView 2018 ディテクションチャレンジで 1 位を獲得した。
標準フォーカルロスと比較して、RFL は稀なクラスの平均再現率（mRecall）を 10.5 パcent point（0.66 から 0.775）向上させ、クラス不均衡の処理における有効性を示した。
スモールカーおよび建物のランダムアンダーサンプリングは、稀なクラスの mAP をさらに向上させ、全データセットで訓練したモデルを上回った。
最終的なアンサンブルモデルは、テスト時増強を組み合わせた結果、パブリック LB で 31.74 mAP を達成。複数のモデルを多様な増強法で統合することで、性能が著しく向上した。
アブレーションスタディにより、RFL が標準フォーカルロスが引き起こす RPN 再現率の低下を緩和し、2段階検出器の設計原理（RPN での再現率最大化）を保持していることが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。