Skip to main content
QUICK REVIEW

[論文レビュー] Gate Decorator: Global Filter Pruning Method for Accelerating Deep Convolutional Neural Networks

Zhonghui You, Kun Yan|arXiv (Cornell University)|Sep 18, 2019
Advanced Neural Network Applications被引用数 111
ひとこと要約

この論文は、グローバルフィルタ剪定のGate Decorator、Tick-Tock剪定、グループ剪定を提案し、アーキテクチャ変更なしでCNNを高速化し、複数データセットで最先端の剪定比と精度向上を実現します。

ABSTRACT

Filter pruning is one of the most effective ways to accelerate and compress convolutional neural networks (CNNs). In this work, we propose a global filter pruning algorithm called Gate Decorator, which transforms a vanilla CNN module by multiplying its output by the channel-wise scaling factors, i.e. gate. When the scaling factor is set to zero, it is equivalent to removing the corresponding filter. We use Taylor expansion to estimate the change in the loss function caused by setting the scaling factor to zero and use the estimation for the global filter importance ranking. Then we prune the network by removing those unimportant filters. After pruning, we merge all the scaling factors into its original module, so no special operations or structures are introduced. Moreover, we propose an iterative pruning framework called Tick-Tock to improve pruning accuracy. The extensive experiments demonstrate the effectiveness of our approaches. For example, we achieve the state-of-the-art pruning ratio on ResNet-56 by reducing 70% FLOPs without noticeable loss in accuracy. For ResNet-50 on ImageNet, our pruned model with 40% FLOPs reduction outperforms the baseline model by 0.31% in top-1 accuracy. Various datasets are used, including CIFAR-10, CIFAR-100, CUB-200, ImageNet ILSVRC-12 and PASCAL VOC 2011. Code is available at github.com/youzhonghui/gate-decorator-pruning

研究の動機と目的

  • resource-constrainedデバイス上でのCNNの効率的な展開を推進するため、計算量とストレージを削減する。
  • 剪定後にネットワーク設計を変更せずにグローバルなフィルタ重要度ランキング法を開発する。
  • 剪定精度を向上させる反復的剪定フレームワーク(Tick-Tock)を提案する。
  • ショートカット接続を持つネットワークにおける剪定制約をグループ剪定で扱う。
  • 分類とセマンティングなど、幅広いビジョンタスクに適用性を示す。

提案手法

  • Gate Decorator (GD) を導入し、Taylor展開ベースのスコア Θ(φ_i) とゲートスケーリング因子 φ によってグローバルなフィルタ重要度を推定する。
  • Batch Normalization に対してGated Batch Normalization (GBN) を定義し、BNチャネルとフィルタを整列させる。
  • Tick-Tock剪定フレームワークを適用する:Tickフェーズは更新可能パラメータを限定したデータのサブセット上でΘを計算;Tockフェーズは φ に対するスパース制約を適用して微調整を行う。
  • ショートカット接続を持つネットワークの剪定を管理するため、純粋なショートカットで接続されたBNブロックをグループ化し、重要度スコアを合計するグループ剪定を導入する。
  • 剪定後にスケーリング因子を統合して追加のアーキテクチャ変更を避ける剪定パイプラインを提供する。
  • Gate Decoratorを関連GFIR手法(Slim、PCNN)と比較し、Taylorベースの推定、スパース性、正規化の考慮点の違いを論じる。

実験結果

リサーチクエスチョン

  • RQ1グローバルなフィルタ重要度ランキングを再訓練せずに信頼性をもって推定できるか。
  • RQ2Gate Decoratorは従来のGFIR手法と比べて、より高い剪定比と精度低下の少なさを実現できるか。
  • RQ3Tick-Tockの反復剪定フレームワークはワンショット剪定より剪定精度を向上させるか。
  • RQ4ショートカット接続を含むネットワークでの剪定を、整列の問題なくどのように実施するか。
  • RQ5Gate Decoratorアプローチは画像分類を超えた異なるビジョンタスクに幅広く適用可能か。

主な発見

手法グローバルTop-1[Top-1] ↓Top-5[Top-5] ↓FLOPs ↓ %パラメータ ↓ %精度 ↓ %
ThiNet-7072.040.8490.670.4736.7533.72-0.84
SFP74.611.5492.060.8141.80--0.81
GBN-6076.19-0.3192.83-0.1640.5431.83-0.16
NISP-0.89--44.0143.82-0.89
FPGM74.831.3292.320.5553.50--0.55
ThiNet-5071.011.8790.021.1255.7651.56-1.12
DCP74.951.0692.320.6155.7651.45-0.61
GDP71.893.2490.711.5951.30--1.59
GBN-5075.180.6792.410.2655.0653.40-0.26
  • ResNet-56でCIFAR-10の精度低下をほとんど発生させずに70%のFLOPs削減という最先端の剪定を達成。
  • ImageNetでは40%のFLOPs削減を行った剪定済みResNet-50がベースラインより0.31%のTop-1精度向上。
  • ImageNet上のGBN-60およびGBN-50は、ベースラインより推論速度を向上させる(例:40%のFLOPs剪定で1127枚/秒 vs Titan X Pascalの864枚/秒)。
  • PASCAL VOC 2011のFCN剪定はFLOPsを27%、パラメータを73%削減しつつ精度を落とさずmIoUを維持。
  • Tick-Tock剪定はOne-ShotおよびTick-Onlyを一貫して上回り、同じFLOP目標で最終精度を向上させ、反復剪定と疎な制約の利点を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。