QUICK REVIEW

[論文レビュー] CSL-YOLO: A New Lightweight Object Detection System for Edge Computing

Yuming Zhang, Chun-Chieh Lee|arXiv (Cornell University)|Jul 10, 2021

Advanced Neural Network Applications参考文献 29被引用数 24

ひとこと要約

本稿では、エッジコンピューティング向けに、FLOPsとパラメータ数を削減しながら高い精度を維持する軽量なオブジェクト検出システム、CSL-YOLOを提案する。CSLモジュールは、標準的な畳み込みを深度方向およびポイントワイド演算に置き換えることで、冗長な特徴を効率的に生成する。これにより、CSL-YOLOは1470 MFLOPsおよび3.2Mパラメータで42.8%のAP50を達成し、Tiny-YOLOv4を上回る精度を示しながら、FLOPsは58%、パラメータ数は47%削減した。

ABSTRACT

The development of lightweight object detectors is essential due to the limited computation resources. To reduce the computation cost, how to generate redundant features plays a significant role. This paper proposes a new lightweight Convolution method Cross-Stage Lightweight (CSL) Module, to generate redundant features from cheap operations. In the intermediate expansion stage, we replaced Pointwise Convolution with Depthwise Convolution to produce candidate features. The proposed CSL-Module can reduce the computation cost significantly. Experiments conducted at MS-COCO show that the proposed CSL-Module can approximate the fitting ability of Convolution-3x3. Finally, we use the module to construct a lightweight detector CSL-YOLO, achieving better detection performance with only 43% FLOPs and 52% parameters than Tiny-YOLOv4.

研究の動機と目的

リソースが限られたエッジデバイスにおける、既存の軽量オブジェクト検出器の高い計算コストを解消すること。
検出精度を損なわず、FLOPsとモデルパラメータ数を削減し、リアルタイムなエッジデプロイメントに最適な推論効率を実現すること。
3x3畳み込みのフィッティング能力を大幅に低い計算量で近似できる新しい畳み込みモジュールの設計。
FLOPsを低く抑えつつ高い精度を実現するように最適化された、CSL-Bone、CSL-FPN、CSL-YOLOからなるフル検出パイプラインの開発。
非指数関数的バウンディングボックス予測とアダプティブアンカ生成を含む、新しい設計選択によりAP性能を向上させること。

提案手法

中間拡張段階で標準的なポイントワイド畳み込みを深度方向畳み込みに置き換えることで、候補特徴を効率的に生成するCSLモジュールを提案。
空間的およびチャネルワイドな演算を分離する深度方向分離畳み込みを用い、標準的な3x3畳み込みと比較してFLOPsを5–7倍削減。
従来の残差ブロックに代わる、スタックされたCSLモジュールから構成される軽量バックボーン、CSL-Boneを設計。
高解像度の特徴を最小限のFLOPsで維持するCSLモジュールを用いた特徴マップピラミッドネットワークの変種、CSL-FPNを設計。
非指数関数的バウンディングボックス予測ヘッドを採用し、直接的にオフセットを回帰する $ w = w_{\text{anchor}} + w_{\text{pred}} $ の形式を採用。これにより、安定性とAPが1–2%向上。
特徴マップのスケールとアンカサイズに基づく新しいアンカ生成戦略を採用し、入力サイズにかかわらず局所化精度を向上。

実験結果

リサーチクエスチョン

RQ13x3畳み込みの表現力に近い性能を発揮するが、FLOPsを5–7倍削減できる軽量畳み込みモジュールを設計できるか？
RQ2CSLモジュールをフル検出アーキテクチャに効果的に統合することで、MS-COCOで最小限のFLOPsとパラメータ数で最先端の性能を達成できるか？
RQ3バウンディングボックス回帰における指数関数の代わりに直接オフセット予測を採用することで、検出精度と学習安定性が向上するか？
RQ4ImageNetの事前学習なしにMS-COCOでスクラッチから訓練されたモデルが、最小限のモデルサイズと推論コストで競争力のあるAPスコアを達成できるか？
RQ5提案手法であるCSL-YOLOは、FLOPs、パラメータ数、AP指標の観点から、既存の軽量YOLOバージョンをどの程度上回るか？

主な発見

CSLモジュールは、標準的な3x3畳み込みと同等のフィッティング能力を維持しながら、FLOPsを5–7倍削減した。
CSL-YOLOは、入力サイズ416x416で1470 MFLOPsおよび3.2Mパラメータで42.8%のAP50を達成し、Tiny-YOLOv4（3450 MFLOPs、6.1Mパラメータで40.2% AP50）を上回る精度を示した。
224x224入力サイズでは、16.5%のAPおよび32.2%のAP50を達成し、FLOPsは425 MFLOPs、パラメータ数は3.2Mで、YOLO-LITEを精度と効率の両面で上回った。
非指数関数的予測により、全入力サイズでAPが1–2%向上し、512x512解像度では26.3%のAP50を達成した。
CSL-YOLOは、軽量YOLO検出器の中で最先端の性能を示し、FLOPsおよびパラメータ数の面で優れた効率性を示した。
ImageNetの事前学習なしにMS-COCOでスクラッチから訓練されたモデルであり、最小限の計算コストで優れた一般化能力を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。