Skip to main content
QUICK REVIEW

[論文レビュー] Enhancement of SSD by concatenating feature maps for object detection

Jisoo Jeong, Hyojin Park|arXiv (Cornell University)|May 26, 2017
Advanced Neural Network Applications被引用数 50
ひとこと要約

Rainbow SSD(R-SSD)は、層間の関係を利用するためにスケールを跨いだ特徴を連結することでSSDを強化し、基本ネットワークを変更せずに競争力のある速度とともにより高いmAPを実現します。

ABSTRACT

We propose an object detection method that improves the accuracy of the conventional SSD (Single Shot Multibox Detector), which is one of the top object detection algorithms in both aspects of accuracy and speed. The performance of a deep network is known to be improved as the number of feature maps increases. However, it is difficult to improve the performance by simply raising the number of feature maps. In this paper, we propose and analyze how to use feature maps effectively to improve the performance of the conventional SSD. The enhanced performance was obtained by changing the structure close to the classifier network, rather than growing layers close to the input data, e.g., by replacing VGGNet with ResNet. The proposed network is suitable for sharing the weights in the classifier networks, by which property, the training can be faster with better generalization power. For the Pascal VOC 2007 test set trained with VOC 2007 and VOC 2012 training sets, the proposed network with the input size of 300 x 300 achieved 78.5% mAP (mean average precision) at the speed of 35.0 FPS (frame per second), while the network with a 512 x 512 sized input achieved 80.8% mAP at 16.6 FPS using Nvidia Titan X GPU. The proposed network shows state-of-the-art mAP, which is better than those of the conventional SSD, YOLO, Faster-RCNN and RFCN. Also, it is faster than Faster-RCNN and RFCN.

研究の動機と目的

  • 入力データ近傍で基盤ネットワークを変更せずにSSDの精度向上を動機づける。
  • 特徴ピラミッドの層間関係をどのように活用してより良い検出を実現できるかを探る。
  • 小さな物体検出を向上させるため、特徴マップの数を効率的に増やす。
  • 分類器で重み共有を有効にしてトレーニング速度と一般化を改善する。)

提案手法

  • Rainbow特徴連結を導入し、低層プーリング特徴と高層デコンボリューション特徴を結合する。
  • 連結前にバッチ正規化を適用して特徴のスケールを正規化する。
  • プーリングベースおよびデコンボリューションベースの連結を実装してマルチスケール情報を融合する。
  • 層間の特徴マップチャネルを揃えることで、スケール横断で重みを共有する単一の分類器ネットワークを提案する。
  • VOC2007+2012を用いて、従来のSSD、プーリング/デコンボリューション variante、ISSD、R-SSDを比較する。

実験結果

リサーチクエスチョン

  • RQ1明示的な層間相互作用は、SSDの特徴ピラミッドで検出精度を向上させ、小さな物体に特に効果があるか。
  • RQ2ピラミッド内でのみ特徴マップチャネルを増やすと、基盤ネットワークには手を加えず、速度を管理可能なまま精度が向上するか。
  • RQ3スケール横断で特徴チャネル次元を揃えた単一の共有分類器は、一般化とトレーニング効率を改善するか。
  • RQ4Rainbow連結は、PASCAL VOC07/12の物体サイズ別のリコールと精度にどう影響するか。

主な発見

  • R-SSD(300入力)は VOC07+12 で 35.0 FPS 時に 78.5% mAP を達成。
  • R-SSD(512入力)は VOC07+12 で 16.6 FPS 時に 80.8% mAP を達成。
  • R-SSDは従来のSSD、YOLO、Faster-RCNN、RFCNをmAPで上回りつつ、競争力のある速度を維持する。
  • スケール横断で重みを共有する単一分類器は、非均衡なデータセットや小さなデータセットでも競争力のある精度を維持し、トレーニング効率を改善できる。
  • ISSDと比較して、R-SSDはより高い精度を、速度低下を抑えた状態で提供し、同等のmAPレベルでFaster-RCNN、RFCNなどのいくつかの代替手段よりも高速です。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。