[論文レビュー] MeliusNet: Can Binary Neural Networks Achieve MobileNet-level Accuracy?
MeliusNetは、DenseBlockとImprovementBlockを備えたバイナリニューラルネットワークアーキテクチャを導入し、特徴量の容量と品質を向上させ、ImageNetで同等のモデルサイズと演算量でMobileNet-v1相当の精度を達成します。
Binary Neural Networks (BNNs) are neural networks which use binary weights and activations instead of the typical 32-bit floating point values. They have reduced model sizes and allow for efficient inference on mobile or embedded devices with limited power and computational resources. However, the binarization of weights and activations leads to feature maps of lower quality and lower capacity and thus a drop in accuracy compared to traditional networks. Previous work has increased the number of channels or used multiple binary bases to alleviate these problems. In this paper, we instead present an architectural approach: MeliusNet. It consists of alternating a DenseBlock, which increases the feature capacity, and our proposed ImprovementBlock, which increases the feature quality. Experiments on the ImageNet dataset demonstrate the superior performance of our MeliusNet over a variety of popular binary architectures with regards to both computation savings and accuracy. Furthermore, with our method we trained BNN models, which for the first time can match the accuracy of the popular compact network MobileNet-v1 in terms of model size, number of operations and accuracy. Our code is published online at https://github.com/hpi-xnor/BMXNet-v2
研究の動機と目的
- ImageNetにおけるBinary Neural Networks (BNN)とコンパクトなネットワーク間の精度ギャップに対処する。
- BNN専用に特徴容量と品質を高めるアーキテクチャ的解決策を提案する。
- 精度を維持または向上させつつ、残差32-bitレイヤの計算負荷を軽減する。
- BNNがモデルサイズ、FLOPs、精度の観点でMobileNet-v1相当の性能に到達できることを示す。
提案手法
- MeliusNetを導入し、DenseBlocks(特徴容量の増加)とImprovementBlocks(特徴品質の向上)を交互に配置する。
- DenseBlockごとに64の新しいバイナリチャネルを特徴マップに結合して連結し、その後残差接続を持つ64チャネルのバイナリImprovementBlockでこれらの特徴を洗練させる。
- 最初の層を grouped-stem アプローチで再設計する(7x7 convを3つの grouped 3x3 convに置換)ことで、モデルサイズを増やさずに32-bit演算を大幅に削減する。
- 初期、最終、およびいくつかのダウンサンプリング畳み込みを二値化することを避け、経験的知見に基づくチャネルごとのスケーリング係数を省略して精度を維持する。
- ImageNet上でスクラッチから訓練する際、特定のSTEベースの二値化を用い、Adam/RAdamオプティマイザとコサイン学習率スケジューリング、オプションのウォームアップを含む。
実験結果
リサーチクエスチョン
- RQ1ImageNetで同等のサイズと計算量でMobileNet-v1相当の精度に到達するバイナリニューラルネットアーキテクチャを設計できるか?
- RQ2BNN向けに特化したアーキテクチャ革新(容量を増やすブロックと品質を向上させるブロック)は、従来のバイナリアーキテクチャに対して測定可能な改善をもたらすか?
- RQ3 grouped-stem 32-bit層の設計は、精度を犠牲にすることなく、コンパクトなネットワークとのギャップを縮めるのに十分な演算量を削減するか?
- RQ4BNNの性能改善は二値アーキテクチャに特有のものか、それとも32-bitネットワークにも拡張されるのか?
主な発見
- MeliusNetは、ImageNetで類似のモデルサイズと演算量の下で従来のバイナリアーキテクチャを一貫して上回る。
- grouped stemは、 tested models全体で32-bit演算を大幅に削減しつつ精度を向上させる。
- A 32-bit version of MeliusNet does not show improvements over DenseNet, indicating the benefits are specific to BNNs.
- MeliusNet configurations can match MobileNet-v1 accuracy for multiple target sizes/operations, demonstrating competitive parity with compact networks.
- The proposed grouped stem combined with the MeliusNet architecture narrows the accuracy gap between BNNs and MobileNet-v1, highlighting potential energy savings on suitable hardware.
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。