Skip to main content
QUICK REVIEW

[論文レビュー] GridMask Data Augmentation

Pengguang Chen, Shu Liu|arXiv (Cornell University)|Jan 13, 2020
Advanced Neural Network Applications参考文献 35被引用数 226
ひとこと要約

GridMaskは、CNNの性能を、画像分類、物体検出、意味セグメンテーションの各領域で改善する、単純で構造化された情報ドロップ augmentation で、 prior dropping methods および AutoAugment を、計算コストを低く抑えたまま上回る。

ABSTRACT

We propose a novel data augmentation method `GridMask' in this paper. It utilizes information removal to achieve state-of-the-art results in a variety of computer vision tasks. We analyze the requirement of information dropping. Then we show limitation of existing information dropping algorithms and propose our structured method, which is simple and yet very effective. It is based on the deletion of regions of the input image. Our extensive experiments show that our method outperforms the latest AutoAugment, which is way more computationally expensive due to the use of reinforcement learning to find the best policies. On the ImageNet dataset for recognition, COCO2017 object detection, and on Cityscapes dataset for semantic segmentation, our method all notably improves performance over baselines. The extensive experiments manifest the effectiveness and generality of the new method.

研究の動機と目的

  • 画像領域の削除と保持のバランスを取ることによって、効果的なデータ拡張を動機づける。
  • 構造化された非連続的な方法で情報をドロップする、単純なグリッドベースのマスキング戦略を提案する。
  • GridMaskの多様なビジョン課題とデータセットにおける有効性を実証する。
  • 実践のための堅牢なガイドラインを確立するため、パラメータ選択と変動を分析する。

提案手法

  • マスキングを二値グリッドマスクMとして表現し、入力xに適用して x~ = x * M とする。
  • 保つ比率kと削除領域のサイズl = r * dを制御するために、パラメータ(r, d, delta_x, delta_y)を用いてグリッドユニットを定義する。
  • 失敗する拡張ケースを最小化するよう、保つ比率、ユニットサイズ、変位範囲を経験的に調査する。
  • トレーニング中にマスクを回転させ、dを変化させて拡張の多様性を高める。
  • GridMaskをImageNet、COCO、Cityscapesで、ベースラインおよびAutoAugmentと比較評価し、逆向きGridMaskやランダムドロップなどのアブレーション変種を含める。

実験結果

リサーチクエスチョン

  • RQ1構造化されたグリッドベースのドロップ戦略は、分類、検出、セグメンテーションのタスク全般で一般化を改善するか。
  • RQ2マスクパラメータ(r, d, delta_x, delta_y)は性能と頑健性にどう影響するか?
  • RQ3GridMaskは既存の情報ドロップ法やAutoAugmentより計算コストを抑えつつ上回ることができるか?
  • RQ4グリッドマスクの変種(逆向きGridMask、ランダムドロップ)が結果に及ぼす影響は何か?

主な発見

  • GridMaskはImageNetのResNet50を76.5%から77.9%に、ResNet152を78.3%から79.7%に改善する。
  • GridMaskはCOCO2017のFaster-RCNN-50-FPNのmAPを37.4%から39.2%に、Faster-RCNN-X101-FPNを41.2%から42.6%に改善する。
  • GridMaskはCityscapesのPSPNet50のmIoUを77.3%から78.1%に改善する。
  • CIFAR-10では、GridMaskが複数のモデルで精度を向上させる(例:ResNet-18は95.28%から96.54%へ)。
  • GridMaskは複数の設定でCutout、HaS、AutoAugmentを上回り、計算オーバーヘッドは最小限に抑える。
  • 逆向きGridMaskと構造化ドロップはランダムドロップを上回り、手法の頑健性を示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。