QUICK REVIEW

[論文レビュー] Random Erasing Data Augmentation

Zhun Zhong, Liang Zheng|arXiv (Cornell University)|Aug 16, 2017

Video Surveillance and Tracking Methods参考文献 36被引用数 748

ひとこと要約

Random Erasing はパラメータなしのデータ拡張手法で、トレーニング画像のランダムな長方形領域を隠し、分類、検出、再識別タスクにおける occlusion への generalization を向上させます。

ABSTRACT

In this paper, we introduce Random Erasing, a new data augmentation method for training the convolutional neural network (CNN). In training, Random Erasing randomly selects a rectangle region in an image and erases its pixels with random values. In this process, training images with various levels of occlusion are generated, which reduces the risk of over-fitting and makes the model robust to occlusion. Random Erasing is parameter learning free, easy to implement, and can be integrated with most of the CNN-based recognition models. Albeit simple, Random Erasing is complementary to commonly used data augmentation techniques such as random cropping and flipping, and yields consistent improvement over strong baselines in image classification, object detection and person re-identification. Code is available at: https://github.com/zhunzhong07/Random-Erasing.

研究の動機と目的

オクルージョンを模倣することによる CNN の汎化性能の向上を動機付ける。
既存の CNN に組み込むことができる、単純でパラメータなしの拡張法を提案する。
画像分類、物体検出、人物再識別の各領域で有効性を示す。
オクルージョンに対する頑健性と、他の拡張法との補完性を示す。

提案手法

トレーニング中、確率 p で画像内の長方形領域をランダムに選択する。
選択した領域をランダムな画素値（または ImageNet の平均）で埋めて消去する。
領域の面積 s_l–s_h とアスペクト比 r_1–r_2 を用いて消去領域のサイズを調整し、異なるオクルージョンレベルを生成する。
全画像の領域をオクルージョンして、画像分類と人物再識別に Random Erasing を適用する。
物体検出には、3つの方式を適用する：image-aware (IRE)、object-aware (ORE)、および image+object-aware (I+ORE)。
Random Erasing をランダムクロップやクロップベースの拡張と比較し、補完性を研究する。
追加のパラメータ学習は不要で、軽量かつ容易に組み込める。

実験結果

リサーチクエスチョン

RQ1Random Erasing は、複数のビジョンタスクにおいてオクルージョン下で CNN の汎化能力を改善しますか？
RQ2消去の確率、面積、アスペクト比は性能にどのように影響しますか？
RQ3Random Erasing はランダムクロッピングや回転など他の拡張と補完的ですか？
RQ4方法は image/object-aware スキームを用いた物体検出に適用できますか？
RQ5この手法はオクルージョンされたテスト例に対して頑健性を提供しますか？],"key_findings":["CIFAR-10、CIFAR-100、および Fashion-MNIST に対して、さまざまなアーキテクチャ（例：ResNet 系、WRN-28-10）でベースラインを上回る精度向上。","CIFAR-10 の ResNet-110 および WRN-28-10 で、Random Erasing はテスト誤差を顕著に低減させる（例：WRN-28-10 は 3.08% の誤差）。","Random Erasing はベースラインを上回り、ランダムクロッピングやフリッピングなど既存の拡張法と競合・補完する。","Fast-RCNN 訓練時に IRE、ORE、または I+ORE を適用すると mAP の向上を生み出す（例：VOC07 で I+ORE が 71.5% mAP に達する）。","人物再識別では、Market-1501、DukeMTMC-reID、CUHK03 のベースライン全体で rank-1 および mAP を一貫して改善。","Random Erasing はオクルージョンに対する頑健性を高め、CIFAR-10 のオクルージョン実験ではベースラインと比べて性能低下が緩やかである。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。