QUICK REVIEW

[論文レビュー] Pruning Algorithms to Accelerate Convolutional Neural Networks for Edge Applications: A Survey

Jiayi Liu, Samarth Tripathi|arXiv (Cornell University)|May 8, 2020

Advanced Neural Network Applications参考文献 52被引用数 41

ひとこと要約

エッジ展開のためのCNNプルーニング手法の包括的な調査で、基準・手順・トレードオフを網羅し、実務上の課題と今後の方向性について議論する。

ABSTRACT

With the general trend of increasing Convolutional Neural Network (CNN) model sizes, model compression and acceleration techniques have become critical for the deployment of these models on edge devices. In this paper, we provide a comprehensive survey on Pruning, a major compression strategy that removes non-critical or redundant neurons from a CNN model. The survey covers the overarching motivation for pruning, different strategies and criteria, their advantages and drawbacks, along with a compilation of major pruning techniques. We conclude the survey with a discussion on alternatives to pruning and current challenges for the model compression community.

研究の動機と目的

CNNのエッジ/IoT展開を可能にするためのモデル圧縮の必要性を動機づける。
プルーニング基準（データ非依存 vs データ駆動）を特徴づけ、トレードオフを整理する。
効果的なプルーニングのためのプルーニングワークフローと反復的トレーニング戦略を説明する。
エッジ環境におけるプルーニングのハードウェア意識事項と実用的な制約を要約する。

提案手法

プルーニング基準をデータ非依存とデータ駆動（データ利用）カテゴリーに分類する。
プルーニング、マスキング、再訓練を組み合わせた反復プルーニングのワークフローを説明する（Algorithm 1 系列）。
重要度指標と最適化手法を概観する（L1/2ノルム、ヘッセ行列ベース、APG、ADMM など）。
構造化プルーニングと非構造化プルーニングの比較、速度向上のための構造認識プルーニングへの移行を議論する。
プルーニングと圧縮予算を自動化する学習ベースおよび強化学習/RL/NASアプローチを要約する。

実験結果

リサーチクエスチョン

RQ1どのプルーニング基準が、精度を損なうことなく非クリティカルなニューロンやフィルターを最も適切に特定できるか？
RQ2反復プルーニング手順は、プルーニングの強度と再訓練をどうバランスさせて精度を回復するか？
RQ3エッジデバイス向けにCNNをプルーニングした際の現実的なハードウェア関連の利得（FLOPs、パラメータ、実測速度）はどれくらいか？
RQ4エッジ展開のためのプルーニングと代替圧縮手法の主なトレードオフと制約は何か？
RQ5エッジAIのプルーニングに残る今後の方向性と未解決の課題は何か？

主な発見

プルーニングはモデルサイズと推論時間を大幅に削減できるが、実機のハードウェア上での実速度向上は必ずしもFLOPsの削減と直接的に相関しない。
構造化プルーニング（例：チャネル/フィルター/プルーニングブロック）は、非構造化の重み削減より実際の速度向上を得やすい傾向がある。ハードウェアの利用効率が改善されるため。
データ認識基準（例：APoZ、活性化エントロピー、ニューラル重要度スコア）等が、プルーニング中の精度保持を向上させるため重要性を増している。
再訓練を伴う反復的プルーニングは、ワンショットのプルーニングより一般に優れているが、スクラッチ学習とプルーニング後の再訓練の最適解はモデルと予算によって異なる。
エッジデバイスでの実資源利用を正しく捉えるために、ハードウェア対応・省エネルギー対応のプルーニングパラダイムが必要である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。