Skip to main content
QUICK REVIEW

[論文レビュー] Stable Rank Normalization for Improved Generalization in Neural Networks and GANs

Amartya Sanyal, Philip H. S. Torr|arXiv (Cornell University)|Jun 11, 2019
Neural Networks and Applications参考文献 34被引用数 33
ひとこと要約

提供されたテキストはICLR 2020提出物の形式設定の指示を含んでおり、安定ランク正規化に関する実際の論文内容ではありません。ここには方法論や結果の詳細は利用できません。

ABSTRACT

Exciting new work on the generalization bounds for neural networks (NN) given by Neyshabur et al. , Bartlett et al. closely depend on two parameter-depenedent quantities: the Lipschitz constant upper-bound and the stable rank (a softer version of the rank operator). This leads to an interesting question of whether controlling these quantities might improve the generalization behaviour of NNs. To this end, we propose stable rank normalization (SRN), a novel, optimal, and computationally efficient weight-normalization scheme which minimizes the stable rank of a linear operator. Surprisingly we find that SRN, inspite of being non-convex problem, can be shown to have a unique optimal solution. Moreover, we show that SRN allows control of the data-dependent empirical Lipschitz constant, which in contrast to the Lipschitz upper-bound, reflects the true behaviour of a model on a given dataset. We provide thorough analyses to show that SRN, when applied to the linear layers of a NN for classification, provides striking improvements-11.3% on the generalization gap compared to the standard NN along with significant reduction in memorization. When applied to the discriminator of GANs (called SRN-GAN) it improves Inception, FID, and Neural divergence scores on the CIFAR 10/100 and CelebA datasets, while learning mappings with low empirical Lipschitz constants.

研究の動機と目的

  • 提供されたテキストには研究目的は含まれておらず、会議の形式設定ガイドラインのみが含まれています。

提案手法

  • 提供されたテキストには方法は記述されておらず、内容はICLR 2020提出物の形式設定指示のみで構成されています。

実験結果

リサーチクエスチョン

  • RQ1提供されたテキストには研究質問はありません。

主な発見

  • 提供されたテキストには発見は報告されていません。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。