Skip to main content
QUICK REVIEW

[論文レビュー] DetectoRS: Detecting Objects with Recursive Feature Pyramid and Switchable Atrous Convolution

Siyuan Qiao, Liang-Chieh Chen|arXiv (Cornell University)|Jun 3, 2020
Advanced Neural Network Applications参考文献 88被引用数 155
ひとこと要約

DetectoRSはRecursive Feature PyramidとSwitchable Atrous Convolutionを組み合わせ、バックボーンを強化し、オブジェクト検出、インスタンスセグメンテーション、パノプティックセグメンテーションでCOCOの最先端性能を達成。

ABSTRACT

Many modern object detectors demonstrate outstanding performances by using the mechanism of looking and thinking twice. In this paper, we explore this mechanism in the backbone design for object detection. At the macro level, we propose Recursive Feature Pyramid, which incorporates extra feedback connections from Feature Pyramid Networks into the bottom-up backbone layers. At the micro level, we propose Switchable Atrous Convolution, which convolves the features with different atrous rates and gathers the results using switch functions. Combining them results in DetectoRS, which significantly improves the performances of object detection. On COCO test-dev, DetectoRS achieves state-of-the-art 55.7% box AP for object detection, 48.5% mask AP for instance segmentation, and 50.0% PQ for panoptic segmentation. The code is made publicly available.

研究の動機と目的

  • 物体検出のために二度見て考えるバックボーンの動機付けと実装。
  • マクロレベルの再帰を特徴ピラミッドに導入し、多尺度表現を豊かにする。
  • マイクロレベルのSwitchable Atrous Convolutionを導入し、受容野をスケール間で適応させる。
  • COCOで検出、セグメンテーション、パノプティックタスクの性能向上を実証。
  • 事前学習済みバックボーンと互換性のあるプラグアンドプレイ方式を提供。

提案手法

  • Recursive Feature Pyramid (RFP)を提案し、上位ダウンFPN層からのフィードバックを下位バックボーンに追加して多重パスのバックボーン表現を作成。
  • Switchable Atrous Convolution (SAC)を導入し、複数の atrous レートで特徴を畳み、場所依存のスイッチで出力を融合。
  • RFP特徴をバックボーンと統合・融合する接続モジュールとしてASPPを使用。
  • アンロールしたRFPステップ間で特徴を更新・ブレンドするフュージョンモジュールを適用。
  • バックボーンの3x3畳み込みをSACに置換し、重みロック機構を備えた事前学習済みネットワークからの簡易変換を可能にする。
  • COCOでの利得を評価するためHTCへRFPとSACを実験的に統合。

実験結果

リサーチクエスチョン

  • RQ1バックボーンのフィードバック(RFP)はオブジェクト検出のためのマルチスケール表現をどのように改善できるか?
  • RQ2Switchable Atrous Convolution (SAC)は再訓練なしでオブジェクトスケール全体の検出を改善できるか?
  • RQ3マクロレベル(RFP)とマイクロレベル(SAC)設計の標準検 detectorsへの組み合わせ効果は?
  • RQ4RFPとSACはCOCOでの境界ボックス検出、インスタンスセグメンテーション、パノプティックセグメンテーションにどう影響するか?

主な発見

方法バックボーンTTAAP_bboxAP_50AP_75AP_SAP_MAP_L備考
HTCResNet-5042.060.845.523.745.556.4COCO val2017のHTCベースライン
RFPResNet-5046.265.150.227.950.360.3RFPはベースラインを約4.2 AP bbox向上
RFP + sharingResNet-5045.464.149.426.549.060.0RFPは共有ブロックを使用
RFP - asppResNet-5045.764.249.626.749.360.5RFPはASPPなし
RFP - fusionResNet-5045.964.750.027.050.160.1融合なしのRFPバリアント
RFP + 3XResNet-5047.566.351.829.051.661.93回のアンロールを用いたRFP
SACResNet-5046.365.850.227.850.662.4Switchable Atrous Convolution
SAC - DCNResNet-5045.365.049.327.548.760.6変形可能畳み込みなしのSAC
SAC - DCN - globalResNet-5044.363.748.225.748.059.6グローバルコンテキストのみのSAC
SAC - DCN - lockingResNet-5044.764.448.726.048.759.0SACの重みをロック
SAC - DCN + DSResNet-5045.164.649.026.349.360.1デュアルスイッチバリアント
  • RFPは箱APを42.0から46.2へ向上、ResNet-50ベースラインで。
  • SACは箱APを46.3へ、ResNet-50で、強いマイクロレベル利得を示す。
  • 組み合わせのDetectoRS (RFP + SAC) with ResNeXt-101-64x4d は COCO test-dev で 55.7% box AP と 48.5% mask AP を達成。
  • DetectoRSは最先端の55.7% box APと48.5% mask AP (ResNeXt-101-64x4d使用) および panoptic segmentationの50.0 PQをCOCO test-devで達成。
  • RFP + SACはHTCベースラインと比較して収束を速く、トレーニング損失の改善も顕著。
  • 可視化は学習されたスイッチがオブジェクトスケールと一致し、SACは大きな物体に対して受容野を拡大。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。