[論文レビュー] Tiny-DSOD: Lightweight Object Detection for Resource-Restricted Usages
tldr: Tiny-DSODは depthwise dense blocks と depthwise FPN を導入し、非常に小さなパラメータサイズと FLOPs で高い mAP を達成し、VOC、KITTI、COCO の他の超効率検出器を上回ります。
Object detection has made great progress in the past few years along with the development of deep learning. However, most current object detection methods are resource hungry, which hinders their wide deployment to many resource restricted usages such as usages on always-on devices, battery-powered low-end devices, etc. This paper considers the resource and accuracy trade-off for resource-restricted usages during designing the whole object detection framework. Based on the deeply supervised object detection (DSOD) framework, we propose Tiny-DSOD dedicating to resource-restricted usages. Tiny-DSOD introduces two innovative and ultra-efficient architecture blocks: depthwise dense block (DDB) based backbone and depthwise feature-pyramid-network (D-FPN) based front-end. We conduct extensive experiments on three famous benchmarks (PASCAL VOC 2007, KITTI, and COCO), and compare Tiny-DSOD to the state-of-the-art ultra-efficient object detection solutions such as Tiny-YOLO, MobileNet-SSD (v1 & v2), SqueezeDet, Pelee, etc. Results show that Tiny-DSOD outperforms these solutions in all the three metrics (parameter-size, FLOPs, accuracy) in each comparison. For instance, Tiny-DSOD achieves 72.1% mAP with only 0.95M parameters and 1.06B FLOPs, which is by far the state-of-the-arts result with such a low resource requirement.
研究の動機と目的
- リソース制限がある環境(低メモリと計算資源)に最適化された軽量な物体検出器を設計する。
- パラメータと FLOPs を最小化しつつ検出精度を維持または向上させる。
- Scratch からのトレーニングと効率的な推論を可能にするコンパクトなアーキテクチャブロックを活用する。
- 軽量な特徴ピラーミッドを通じたフロントエンドのセマンティック融合を調査する。
- 複数データセットにまたがる最先端の超効率検検出器とベンチマークを行う。
提案手法
- DenseNet の密集ブロックを置換する depthwise dense blocks (DDB) を提案。2つのバリアント DDB-a と DDB-b; 効率と精度の点で backbone には DDB-b を選択。
- 深度方向の畳み込みと線形補間によるアップサンプリング経路を用いて、スケールを横断するセマンティック情報を統合する front-end の depthwise FPN (D-FPN) を導入。
- DSOD に触発された深部監視を備えた SSD フレームワーク上に Tiny-DSOD を構築し、Scratch からのトレーニングを可能にする。
- VOC07+12 で scratch からトレーニングし、VOC2007、KITTI、COCO でデータ拡張とオンライン難例マイニングを用いて評価する。
- mAP、パラメータ数、FLOPs の面で Tiny-YOLO、SqueezeDet、MobileNet-SSD、Pelee、DSOD ベースラインと比較する。
実験結果
リサーチクエスチョン
- RQ1深度wise dense block ベースの backbone と depthwise FPN フロントエンドの組み合わせは、物体検出における精度と資源のトレードオフで好ましい結果をもたらすか。
- RQ2同様のリソース配分の下で DDB-b と DDB-a の精度と計算量への影響はどうなるか。
- RQ3軽量なフロントエンド (D-FPN) は Benchmark 全体で FLOPs/パラメータの増加を最小限に抑えつつ有意な精度向上を提供するか。
- RQ4VOC07、KITTI、COCO において Tiny-DSOD は mAP、パラメータサイズ、FLOPs の点で他の超効率検出器に対してどう機能するか。
主な発見
- Tiny-DSOD は VOC2007 で 72.1% mAP を 0.95M パラメータと 1.06B FLOPs で達成。
- DDB-b backbone は 同等のリソース予算下で DDB-a より優れており(例: 0.90M params: DDB-b が 70.2% mAP、DDB-a は 63.1%)。
- D-FPN は約 0.03B FLOPs と 0.05M パラメータを追加するが、VOC2007 で約 1.9% の mAP 向上をもたらす。
- Tiny-DSOD は TitanX 上の 300x300 入力で 105 FPS (9.5 ms) で動作し、いくつかの軽量検出器を速度で上回り、はるかに少ないパラメータで動作する。
- KITTI では Tiny-DSOD は 0.85M パラメータと 4.1B FLOPs で 77.0% mAP を達成し、いくつかのコンパクトな検出器を上回る。
- COCO test-dev では Tiny-DSOD は 23.2 AP@IoU 0.5:0.95、1.12B FLOPs、1.15M パラメータで、軽量モデルの中では MobileNet-SSD および PeleeNet を上回り、いくつかの完全検出器に近づく。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。