[論文レビュー] Efficient Winograd Convolution via Integer Arithmetic
本稿では、有理数算術を越えて効率的な整数演算を可能にする複雑な Winograd 卷積アルゴリズムを導入し、直接法よりも演算複雑度を 3.13× 減少させ、有理数 Winograd 法よりも最大 17.37% の効率向上を達成する。さらに、最小限の精度損失で 30.77% のフィルタービット幅を短縮できる整数フレンドリーなフィルタースケーリング方式を提案し、整数のみのハードウェアアクセラレータ上で高性能な推論を実現する。
Convolution is the core operation for many deep neural networks. The Winograd convolution algorithms have been shown to accelerate the widely-used small convolution sizes. Quantized neural networks can effectively reduce model sizes and improve inference speed, which leads to a wide variety of kernels and hardware accelerators that work with integer data. The state-of-the-art Winograd algorithms pose challenges for efficient implementation and execution by the integer kernels and accelerators. We introduce a new class of Winograd algorithms by extending the construction to the field of complex and propose optimizations that reduce the number of general multiplications. The new algorithm achieves an arithmetic complexity reduction of $3.13$x over the direct method and an efficiency gain up to $17.37\%$ over the rational algorithms. Furthermore, we design and implement an integer-based filter scaling scheme to effectively reduce the filter bit width by $30.77\%$ without any significant accuracy loss.
研究の動機と目的
- 整数のみのハードウェアアクセラレータおよびカーネル上で Winograd 卷積を効率的に実装する課題に対処すること。
- 固定小数点算術環境で高いオーバーヘッドを生じる有理数ベースの Winograd アルゴリズムの制限を克服すること。
- 一般乗算の回数を削減し、算術効率を向上させるために、複素数体を用いた新しいクラスの Winograd アルゴリズムを開発すること。
- 精度の著しい低下を伴わずにビット幅を短縮できる、ハードウェアフレンドリーな整数ベースのフィルタ精度スケーリング方式を設計すること。
- 量子化ニューラルネットワークにおける複雑な Winograd 卷積と精度スケーリングの組み合わせの実現可能性と性能向上を実証すること。
提案手法
- 有理数体 ℚ からの Winograd アルゴリズム構築を複素数体 ℂ に拡張し、より効率的な整数算術計算を可能にする。
- 複素 Winograd アルゴリズムにおける一般乗算回数を最小化する最適化技術を適用し、低い演算複雑度を達成する。
- 整数算術を用いて Winograd 領域のフィルタをスケーリングするスケーリング方式を設計し、ビット幅を 30.77% 減少させる。
- 最適な整数スケーリング係数を用いて実数値スケーリングを近似し、静的数値誤差および比例誤差を最小限に抑える。
- 提案された Winograd 法およびスケーリング手法を、量子化モデル(例:Inception V3、ResNet V2-50)に統合し、エンドツーエンドの評価を実施する。
- 標準ベンチマーク(ILSVRC-12)を用いて、参照量子化モデルと比較して精度と効率を評価する。
実験結果
リサーチクエスチョン
- RQ1複素数体への Winograd 卷積の拡張が、整数算術環境における算術効率の向上と一般乗算回数の削減に寄与するか。
- RQ2複素数領域におけるアルゴリズム最適化によって、Winograd 卷積における一般乗算回数をどの程度削減できるか。
- RQ3Winograd 領域における整数ベースのスケーリングによって、どの程度の精度損失を伴わずフィルタービット幅を短縮できるか。
- RQ4量子化ニューラルネットワークにおける推論精度に、複雑な Winograd 卷積と精度スケーリングの組み合わせが及ぼす影響は何か。
- RQ5整数ハードウェア上で、既存の有理数 Winograd アルゴリズムと比較して、提案手法の効率性と精度はどのように異なるか。
主な発見
- 提案された複雑な Winograd アルゴリズムは、直接法と比較して演算複雑度が 3.13× 減少した。
- ハードウェアのビット幅を考慮した場合、最良の既存の有理数 Winograd アルゴリズムよりも 15.93% ~ 17.37% の効率向上を達成した。
- 整数ベースのフィルタースケーリング方式により、フィルタービット幅が 30.77% 減少し、平均数値誤差は 1.12、平均比例誤差は 0.1% であった。
- Inception V3 において、提案手法を用いることで、トップ-1 精度は 73.69%(Δ = -0.22%)を維持し、トップ-5 精度は 90.3%(Δ = -0.67%)を達成した。
- ResNet V2-50 ではトップ-1 精度がわずか 0.13% の低下(73.21% vs. 73.34%)に抑えられ、トップ-5 精度は同一の 90.83% を維持した。これは精度損失がほとんどないことを確認している。
- 複雑な Winograd 卷積と精度スケーリングの組み合わせにより、精度の著しい低下を伴わず、整数のみのハードウェア上で高性能な推論が可能になった。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。