Skip to main content
QUICK REVIEW

[論文レビュー] Tiny SSD: A Tiny Single-shot Detection Deep Convolutional Neural Network for Real-time Embedded Object Detection

Alexander Wong, Mohammad Javad Shafiee|arXiv (Cornell University)|Feb 19, 2018
Advanced Neural Network Applications被引用数 41
ひとこと要約

tldr: Tiny SSD は、非均質な Fire ベースのサブネットワークと最適化された SSD の特徴層を統合したコンパクトなワンショット検出器で、2.3MB のモデルサイズと VOC 2007 での 61.3% mAP を実現し、Tiny YOLO よりも性能を上回りつつはるかに少ない MACs を使用するリアルタイム埋め込み物体検出を達成します。

ABSTRACT

Object detection is a major challenge in computer vision, involving both object classification and object localization within a scene. While deep neural networks have been shown in recent years to yield very powerful techniques for tackling the challenge of object detection, one of the biggest challenges with enabling such object detection networks for widespread deployment on embedded devices is high computational and memory requirements. Recently, there has been an increasing focus in exploring small deep neural network architectures for object detection that are more suitable for embedded devices, such as Tiny YOLO and SqueezeDet. Inspired by the efficiency of the Fire microarchitecture introduced in SqueezeNet and the object detection performance of the single-shot detection macroarchitecture introduced in SSD, this paper introduces Tiny SSD, a single-shot detection deep convolutional neural network for real-time embedded object detection that is composed of a highly optimized, non-uniform Fire sub-network stack and a non-uniform sub-network stack of highly optimized SSD-based auxiliary convolutional feature layers designed specifically to minimize model size while maintaining object detection performance. The resulting Tiny SSD possess a model size of 2.3MB (~26X smaller than Tiny YOLO) while still achieving an mAP of 61.3% on VOC 2007 (~4.2% higher than Tiny YOLO). These experimental results show that very small deep neural network architectures can be designed for real-time object detection that are well-suited for embedded scenarios.

研究の動機と目的

  • リアルタイム埋め込み物体検出器を、精度を犠牲にせずに最小のモデルサイズで設計する。
  • Fire モジュールの効率性と SSD のマルチスケール予測を活用して Tiny SSD を構築する。
  • VOC 2007/2012 の埋め込み物体検出ベースラインと Tiny SSD を比較評価する。
  • 埋め込み展開のためのパラメータ精度最適化を実証する。

提案手法

  • 非均一な最適化 Fire サブネットワークを、非均一なスタックの SSD ベースの補助畳み込み特徴層へ供給する二つのサブネットワークアーキテクチャを採用する。
  • パラメータを最小化しつつ精度を保持するよう Fire モジュールのマイクロアーキテクチャを最適化する。
  • マルチスケール検出のために、非均一で低パラメータ構成の SSD 補助特徴層を設計・調整する。
  • メモリ使用量を減らすために半精度(16-bit)パラメータ表現を適用する。
  • RMSProp、0.00001 基本学習率、220k イテレーションで Caffe で訓練する。

実験結果

リサーチクエスチョン

  • RQ1Tiny SSD は組込みデバイスにおけるモデルサイズ、推論速度、検出精度のバランスをどう取るのか?
  • RQ2Fire ベースのアーキテクチャと SSD 特徴層を組み合わせることで、モデルサイズを大幅に削減しつつ VOC で競争力のある mAP を達成できるのか?
  • RQ3Fire モジュールと SSD 層の非均一なマイクロアーキテクチャ使用のトレードオフは何か?
  • RQ4Tiny SSD は VOC 2007/2012 で精度と効率の点で Tiny YOLO と比較してどうか?
  • RQ5低精度パラメータが検出性能とサイズに与える影響はどの程度か?

主な発見

  • Tiny SSD のモデルサイズは 2.3MB で、Tiny YOLO の約 26 倍小さい。
  • Tiny SSD は VOC 2007 で 61.3% mAP を達成し、Tiny YOLO より約 4.2%高い。
  • Tiny SSD は推論に 571.09M MACs を必要とする。
  • Tiny SSD の非均一 Fire および SSD レイヤ設計は、パラメータを最小化しつつ精度を保持する。
  • 定性的な例では、Tiny SSD は Tiny YOLO が見逃す物体を検出することがあり、カテゴリラベリングの質が向上する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。