Skip to main content
QUICK REVIEW

[論文レビュー] Survey of Dropout Methods for Deep Neural Networks

Alex Labach, Hojjat Salehinejad|arXiv (Cornell University)|Apr 25, 2019
Adversarial Robustness in Machine Learning参考文献 46被引用数 46
ひとこと要約

深層ニューラルネットワークの dropout 手法の包括的概観で、標準ドロップアウト、CNN/RNN向けの派生、モデル圧縮、モンテカルロドロップアウト、理論的基礎を扱う。

ABSTRACT

Dropout methods are a family of stochastic techniques used in neural network training or inference that have generated significant research interest and are widely used in practice. They have been successfully applied in neural network regularization, model compression, and in measuring the uncertainty of neural network outputs. While original formulated for dense neural network layers, recent advances have made dropout methods also applicable to convolutional and recurrent neural network layers. This paper summarizes the history of dropout methods, their various applications, and current areas of research interest. Important proposed methods are described in additional detail.

研究の動機と目的

  • 深層学習における dropout 手法の歴史と範囲を要約する。
  • 標準ドロップアウトとその理論的解釈と限界を説明する。
  • トレーニング用、畳み込み層および再帰層向けの dropout の派生とモデル圧縮を調査する。
  • モンテカルロドロップアウトと不確実性推定における役割を論じる。
  • dropout 手法の現在の研究動向と今後の展望を概説する。

提案手法

  • 元の dropout の定式化とテスト時のスケーリングを提示する。
  • 代替 dropout 技法を説明する(DropConnect、Fast Dropout、Standout、変分 dropout)。
  • 適応型 dropout アプローチを説明する(アニーリング型、カリキュラム型、ベイズに着想を得た手法)。
  • CNN 固有のドロップアウトを詳述する(空間ドロップアウト、カットアウト、最大プーリングドロップアウト、残差ネットワーク)。
  • RNN/LSTM 指向の dropout 手法を説明する(RNNdrop、変分 RNN dropout、重みをドロップした LSTM、再帰的 dropout、Zoneout)。
  • dropout を用いたモデル圧縮と不確実性推定のためのモンテカルロ dropout について論じる。

実験結果

リサーチクエスチョン

  • RQ12012年以降に開発された主要な dropout 手法とその主な特徴は何か?
  • RQ2dropout 手法は畳み込みおよび再帰型アーキテクチャにどのように一般化されるか?
  • RQ3dropout 含むアプローチはモデル圧縮と不確実性推定にどのような役割を果たすか?
  • RQ4dropout 手法を支える理論的解釈は何か(アンサンブル平均、ベイズ的観点)?

主な発見

  • dropout は共適応の防止と一般化の向上を目的とした正則化手法として発祥した。
  • 広範な dropout の派生は学習速度、正則化、異なるアーキテクチャへの適応性を改善する。
  • CNNとRNN向けの専門的な dropout 手法は、相関した活性化とメモリ保持の制約を標準の dropout の限界に対処する。
  • モンテカルロ dropout は学習手順を変えずに不確実性推定を可能にする。
  • dropout 手法は疎化や構造化 dropout の枠組みを通じてモデル圧縮に寄与する。
  • 理論的枠組みは dropout をアンサンブル平均とベイズ推定に結びつけ、今後の発展を導く。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。