Skip to main content
QUICK REVIEW

[論文レビュー] Explicit Regularisation in Gaussian Noise Injections

Alexander Camuto, Matthew Willetts|arXiv (Cornell University)|Jul 14, 2020
Sparse and Compressive Sensing Techniques参考文献 48被引用数 36
ひとこと要約

本論文はニューラルネットワークへのガウスノイズ注入から明示的な正則化項を導出し、それが高周波成分を抑制すること(特に出力近傍で)を示し、より大きなマージンを持つ較正された分類器へと繋がる、ということを示している。

ABSTRACT

We study the regularisation induced in neural networks by Gaussian noise injections (GNIs). Though such injections have been extensively studied when applied to data, there have been few studies on understanding the regularising effect they induce when applied to network activations. Here we derive the explicit regulariser of GNIs, obtained by marginalising out the injected noise, and show that it penalises functions with high-frequency components in the Fourier domain; particularly in layers closer to a neural network's output. We show analytically and empirically that such regularisation produces calibrated classifiers with large classification margins.

研究の動機と目的

  • ネットワークの活性化層に適用されるガウスノイズ注入(GNI)によって誘起される正則化効果を動機づけ、理解する。
  • 注入されたノイズを周辺化することによって、解析的な明示的正則化項を導出する。
  • この正則化項がソボレフ空間とフーリエ領域に関連することを示す。
  • GNIs がより大きな分類マージンと改善された較正をもたらすことを実証する。
  • 回帰と分類の設定の両方で、解析的および経験的証拠を提供する。

提案手法

  • 各隠れ層に注入される等方的ガウスノイズが損失に与える影響を、層の活性化のテイラー展開を用いてモデル化する。
  • 注入されたノイズを周辺化して、上位の高次残項を支配する明示的正則化項 R を得る(定理1) 。
  • 回帰と分類のケースで R を表現し、ネットワークのヤコビ行列やヘシアンと結びつける(式(11)–(14)) 。
  • R をソボレフ空間とフーリエ変換に結びつけ、低周波数(滑らかな)関数へのバイアスを示す(定理2と関連する議論)。
  • 早い層が高周波ペナルティにより多く寄与する再帰的な層ごとの正則化を実証し、深い層ほど徐々に滑らかになる(層ごとの議論)。
  • GNIs と R が類似した学習ダイナミクスと低周波学習を誘発することを、経験的証拠として示す(図3および図4)。

実験結果

リサーチクエスチョン

  • RQ1ニューラルネットワークの活性化に適用されるガウスノイズ注入によって誘発される明示的な正則化は何か?
  • RQ2この正則化項は、学習された関数のソボレフ空間とフーリエスペクトルとどのように関連しているか?
  • RQ3この正則化はより滑らかな(低周波数の)関数とより大きな分類マージンを促進するか?
  • RQ4GNI は回帰および分類設定におけるモデルの較正とロバスト性を向上させるか?

主な発見

  • GNIs から追加される正則化項 R は、実際には正の値をもち、上位の高次残項を支配する。
  • R はソボレフノルムや高周波成分を抑制するフーリエ領域のペナルティと結びつく。
  • GNIsによる正則化は出力に近い層ほど強く、徐々に低周波数表現を促進する。
  • 経験的には、GNIとRで訓練されたモデルは類似の学習軌道を示し、感度が低く、より良い較正を示す。
  • 回帰では、明示的正則化は層のヤコビ行列のフロベニウスノルムの和に、ノイズ分散で重み付けされた形に簡略化される(式(11))。
  • 分類では、 R は損失のヘシアンを含み、正の周波数ペナルティ項として残る(式(13)-(14)) 。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。