QUICK REVIEW

[論文レビュー] Learning to Reweight Examples for Robust Deep Learning

Mengye Ren, Wenyuan Zeng|arXiv (Cornell University)|Mar 24, 2018

Machine Learning and Data Classification参考文献 40被引用数 579

ひとこと要約

本論文は、少数のクリーンな検証セットを用いて訓練例の重みづけを学習するオンラインのメタ学習手法を提案し、追加のハイパーパラメータ調整なしでクラス不均衡とノイズのあるラベルに対するロバスト性を向上させる。

ABSTRACT

Deep neural networks have been shown to be very powerful modeling tools for many supervised learning tasks involving complex input patterns. However, they can also easily overfit to training set biases and label noises. In addition to various regularizers, example reweighting algorithms are popular solutions to these problems, but they require careful tuning of additional hyperparameters, such as example mining schedules and regularization hyperparameters. In contrast to past reweighting methods, which typically consist of functions of the cost value of each example, in this work we propose a novel meta-learning algorithm that learns to assign weights to training examples based on their gradient directions. To determine the example weights, our method performs a meta gradient descent step on the current mini-batch example weights (which are initialized from zero) to minimize the loss on a clean unbiased validation set. Our proposed method can be easily implemented on any type of deep network, does not require any additional hyperparameter tuning, and achieves impressive performance on class imbalance and corrupted label problems where only a small amount of clean validation data is available.

研究の動機と目的

深層ネットワークにおける訓練データのバイアスを問題として動機づけ、堅牢な解法を追求する。
検証損失を最小化するように例の重みを学習するメタ学習フレームワークを提案する。
任意の深層ネットワークに適用可能な追加ハイパーパラメータなしのオンライン再重み付けアルゴリズムを開発する。
限られたクリーン検証データで、クラス不均衡およびノイズ付きラベルのベンチマークにおける堅牢性の改善を実証する。

提案手法

小さなクリーン集合上の検証損失に導かれる形で、損失 f_i に対して重み w を用いて訓練を行う2レベルの目的を定式化する。
検証損失に対するワンステップのメタ勾配によって重みを計算し、非負の正規化された重みを得る。
各訓練サンプルの重みについて勾配を得るため、逆伝播の逆伝播を用いた自動微分でこの手法を実装する。
バッチごとの重みを合計1になるよう正規化し、安定した有効学習率を保証する。
穏やかな仮定の下で本法が検証損失の臨界点へ収束することを示す収束保証を提供する。
任意の深層アーキテクチャ（MLP/CNN）への適用性を示し、追加の前方/後方伝搬による計算オーバーヘッド（約3倍）を議論する。

実験結果

リサーチクエスチョン

RQ1訓練例のオンライン勾配ベース再重み付けが、少しのクリーン検証セットに導かれ、ラベルノイズとクラス不均衡に対するロバスト性を改善できるか？
RQ2提案されたメタ学習再重み付けアルゴリズムは検証目的へ収束するか、またその収束挙動はどうなるか？
RQ3不均衡データとノイズ付きラベルを含む標準ベンチマークで、既存の再重み付け手法や正則化手法と比べて本手法はどう性能を示すか？
RQ4追加のハイパーパラメータ調整なしで、一般的なアーキテクチャ（MLP/CNN）に実用的か？
RQ5クリーン検証セットのサイズが性能と正則化に与える影響は何か？

主な発見

Model	CIFAR-10	CIFAR-100
Baseline	67.97 ± 0.62	50.66 ± 0.24
Reed-Hard	69.66 ± 1.21	51.34 ± 0.17
S-Model	70.64 ± 3.09	49.10 ± 0.58
MentorNet	76.6	56.9
Random	86.06 ± 0.32	58.01 ± 0.37
Using 1,000 clean images - Clean Only	46.64 ± 3.90	9.94 ± 0.82
Baseline +FT	78.66 ± 0.44	54.52 ± 0.40
MentorNet +FT	78	59
Random +FT	86.55 ± 0.24	58.54 ± 0.52
Ours	86.92 ± 0.19	61.34 ± 2.06

本手法は、限られたクリーン検証データで、クラス不均衡とノイズ付きラベルの両方の問題に対して堅牢性の向上をもたらす。
MNIST 4-9の不均衡実験では、極端な200:1を含む不均衡比に対しても、ベースラインを大幅に上回る。
UniformFlipとBackgroundFlipノイズを含むCIFARで、ベースラインおよび最先端競合他社と比べて最高の性能を達成し、特に利用可能なクリーン検証データがある場合に顕著。
例の重み分布から示されるように、ノイズの多いまたは矛盾する例を低重み付けし、有益な例を高重み付けする傾向がある。
収束解析は、本法が検証損失を減少させ、妥当な条件下でO(1/ε^2)の収束速度を達成することを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。