QUICK REVIEW

[論文レビュー] FSNet: Compression of Deep Convolutional Neural Networks by Filter Summary

Shuicheng Yan, Jiahui Yu|arXiv (Cornell University)|Apr 30, 2020

Advanced Neural Network Applications参考文献 24被引用数 9

ひとこと要約

FSNetは、重複するフィルターセグメントが重複して重みを再利用する、共有1次元フィルターサマリー（FS）に標準的な畳み込みフィルタを置き換えることで、深層畳み込みニューラルネットワーク（CNN）を圧縮する。この手法により、最小限の精度損失で高い圧縮が可能となり、量子化と微分可能トレーニングをサポートし、画像分類および物体検出の分野でベースラインモデルを上回る性能を発揮する。

ABSTRACT

We present a novel method of compression of deep Convolutional Neural Networks (CNNs) by weight sharing through a new representation of convolutional filters. The proposed method reduces the number of parameters of each convolutional layer by learning a 1D vector termed Filter Summary (FS). The convolutional filters are located in FS as overlapping 1D segments, and nearby filters in FS share weights in their overlapping regions in a natural way. The resultant neural network based on such weight sharing scheme, termed Filter Summary CNNs or FSNet, has a FS in each convolution layer instead of a set of independent filters in the conventional convolution layer. FSNet has the same architecture as that of the baseline CNN to be compressed, and each convolution layer of FSNet has the same number of filters from FS as that of the basline CNN in the forward process. With compelling computational acceleration ratio, the parameter space of FSNet is much smaller than that of the baseline CNN. In addition, FSNet is quantization friendly. FSNet with weight quantization leads to even higher compression ratio without noticeable performance loss. We further propose Differentiable FSNet where the way filters share weights is learned in a differentiable and end-to-end manner. Experiments demonstrate the effectiveness of FSNet in compression of CNNs for computer vision tasks including image classification and object detection, and the effectiveness of DFSNet is evidenced by the task of Neural Architecture Search.

研究の動機と目的

深層畳み込みニューラルネットワーク（CNN）におけるパrameter数を顕著な精度低下なしに削減すること。
1次元フィルターレプリゼンテーションに基づく新しい重み共有メカニズムを用いて、効率的なモデル圧縮を実現すること。
さらなるモデルサイズ削減を可能にするために、重み量子化と互換性を持つ圧縮手法を設計すること。
バックプロパゲーションを用いてエンドツーエンドで最適な重み共有パターンを学習できる微分可能バージョンの手法を開発すること。
画像分類および物体検出を含む実世界のコンピュータビジョンタスクにおいて、このアプローチの有効性を検証すること。

提案手法

複数の畳み込みフィルタを重複する1次元セグメントとして表す1次元ベクトル「フィルターサマリー（FS）」を導入する。
FSNetの各畳み込み層では、独立したフィルタの代わりに1つのFSベクトルを用い、重複領域で重みを共有する。
フォワードパスではベースラインCNNと同一のフィルタ数を維持するため、アーキテクチャの互換性が保たれる。
バックプロパゲーションを用いてエンドツーエンドで最適なフィルタ共有パターンを学習できる微分可能トレーニング方式（DFSNet）を採用する。
重み量子化をサポートし、性能の著しい低下なしにさらなる圧縮を可能にする。
修正されたフィルターパラメータ化を施した標準的なCNNレイヤーを用いることで、パrameter効率を実現する。

実験結果

リサーチクエスチョン

RQ1共有1次元フィルターレプリゼンテーションは、モデル精度を維持したまま畳み込み層のパラメータ数を顕著に削減できるか？
RQ2フィルターサマリー手法は、最小限の精度損失で高い圧縮比を達成できるか？
RQ3微分可能バージョン（DFSNet）は、非微分可能バージョンに比べてどの程度性能が向上するか？
RQ4提案手法は重み量子化と効果的に組み合わせられ、さらにモデルサイズを削減できるか？
RQ5この手法は、画像分類や物体検出を含む多様なコンピュータビジョンタスクに十分に一般化できるか？

主な発見

FSNetは、個々のフィルタを共有1次元フィルターサマリー（FS）ベクトルに置き換えることで、CNNにおける顕著なパラメータ削減を実現する。
この手法は、ベースラインと同一の1層あたりのフィルタ数を維持するため、互換性と一貫した推論動作が保証される。
パラメータ数の削減に起因する高い計算加速効果が得られ、画像分類ベンチマークにおいて最小限の精度低下で実現される。
重み量子化と組み合わせることで、顕著な性能低下なしにさらなる高い圧縮比が達成される。
微分可能バージョンであるDFSNetは、エンドツーエンドで最適な重み共有パターンを学習し、ニューラルアーキテクチャサーチタスクでの性能向上を実現する。
画像分類および物体検出を含むコンピュータビジョンタスク全体にわたり、優れた一般化性能を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。