Skip to main content
QUICK REVIEW

[論文レビュー] On the Universal Approximability of Quantized ReLU Neural Networks.

Yukun Ding, Jinglan Liu|arXiv (Cornell University)|Feb 10, 2018
Advanced Neural Network Applications参考文献 15被引用数 6
ひとこと要約

本稿では、量子化されたReLUニューラルネットワークの普遍的近似可能性を確立し、与えられた誤差境界内で任意の連続関数を近似可能であることを証明している。さらに、近似誤差と重みのビット幅に基づいて、関数に依存しないおよび関数に依存するネットワーク構造の両方のストレージサイズの理論的上限を導出しており、量子化ネットワークにおける初めてのこのような解析である。

ABSTRACT

Compression is a key step to deploy large neural networks on resource-constrained platforms. As a popular compression technique, quantization constrains the number of distinct weight values and thus reducing the number of bits required to represent and store each weight. In this paper, we study the representation power of quantized neural networks. First, we prove the universal approximability of quantized ReLU networks. Then we provide upper bounds of storage size given the approximation error bound and the bit-width of weights for function-independent and function-dependent structures. To the best of the authors' knowledge, this is the first work on the universal approximability as well as the associated storage size bound of quantized neural networks.

研究の動機と目的

  • 量子化されたReLUニューラルネットワークが、連続関数を普遍的に近似可能かどうかを調査すること。
  • 所望の近似誤差を達成するために必要なストレージサイズの理論的上限を導出すること。
  • 関数に依存しないおよび関数に依存するネットワーク構造の2つの設定におけるストレージ効率を分析すること。
  • 代表的表現力とメモリ使用量の観点から、量子化ニューラルネットワークに対する基礎的な理論的保証を確立すること。

提案手法

  • 重みの量子化下での関数近似の理論的分析を用いて、量子化されたReLUネットワークの普遍的近似可能性を証明した。
  • 近似誤差と重みのビット幅、ネットワーク構造との関係を用いて、ストレージサイズの上界を導出した。
  • 関数に依存しないおよび関数に依存する量子化構造の違いを明確にし、それぞれのストレージ効率を分析した。
  • ReLU活性化関数と量子化された重み空間の数学的分析を用いて、表現能力の理論的限界を確立した。
  • 量子化ネットワークにおける近似誤差、ビット幅、ストレージサイズの間のトレードオフを形式化した。

実験結果

リサーチクエスチョン

  • RQ1量子化されたReLUニューラルネットワークは、任意の連続関数を普遍的に近似可能か?
  • RQ2量子化されたReLUネットワークで所定の近似誤差を達成するために必要なストレージサイズの上界は何か?
  • RQ3関数に依存しない構造と関数に依存する構造の選択が、ストレージ効率にどのように影響するか?
  • RQ4量子化ネットワークにおける重みのビット幅と近似精度の理論的関係は何か?

主な発見

  • 量子化されたReLUネットワークは普遍的近似可能であり、任意の連続関数を任意の精度で近似可能である。
  • 本稿では、近似誤差の逆数の二乗および重みのビット幅に比例するストレージサイズの上界を確立した。
  • 同じ誤差制約下で、関数に依存する量子化構造の方が、関数に依存しない構造よりも高いストレージ効率を達成する。
  • 理論的バウンドは、リソース制約下での展開に適したコンパクトで高精度な量子化ニューラルネットワークの設計に、原則的根拠を提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。