[论文解读] GridMask Data Augmentation
GridMask 是一种简单、结构化的信息丢弃增强方法,在图像分类、目标检测和语义分割等任务中提升 CNN 性能,优于以往的丢弃方法和 AutoAugment,计算开销更低。
We propose a novel data augmentation method `GridMask' in this paper. It utilizes information removal to achieve state-of-the-art results in a variety of computer vision tasks. We analyze the requirement of information dropping. Then we show limitation of existing information dropping algorithms and propose our structured method, which is simple and yet very effective. It is based on the deletion of regions of the input image. Our extensive experiments show that our method outperforms the latest AutoAugment, which is way more computationally expensive due to the use of reinforcement learning to find the best policies. On the ImageNet dataset for recognition, COCO2017 object detection, and on Cityscapes dataset for semantic segmentation, our method all notably improves performance over baselines. The extensive experiments manifest the effectiveness and generality of the new method.
研究动机与目标
- 通过在删除与保留图像区域之间取得平衡来推动有效数据增强。
- 提出一种简单的基于网格的掩模策略,以结构化、非连续的方式丢弃信息。
- 在多种视觉任务和数据集上证明 GridMask 的有效性。
- 分析参数选择与变体,以为实践建立稳健的指南。
提出的方法
- 将掩模表示为二进制网格掩模 M,通过 x~ = x * M 将其应用于输入 x。
- 用参数 (r, d, delta_x, delta_y) 定义网格单元,以控制保留比 k 和被丢弃区域的大小 l = r * d。
- 实证研究保留比、单元大小和位移范围,以最小化不成功的增强情况。
- 在训练中旋转掩模并改变 d,以增加增强的多样性。
- 在 ImageNet、COCO 和 Cityscapes 上对 GridMask 进行评估,与基线和 AutoAugment 对比,包括如反向 GridMask 和随机丢弃等消融变体。
实验结果
研究问题
- RQ1结构化网格基丢弃策略是否能在分类、检测和分割任务上提升泛化能力?
- RQ2掩模参数 (r, d, delta_x, delta_y) 如何影响性能和鲁棒性?
- RQ3GridMask 能在较低计算成本下超越现有信息丢弃方法和 AutoAugment 吗?
- RQ4网格掩模变体(反向 GridMask、随机丢弃)对结果有何影响?
主要发现
- GridMask 将 ImageNet 的 ResNet50 从 76.5% 提升到 77.9%,将 ResNet152 从 78.3% 提升到 79.7%。
- GridMask 将 COCO2017 Faster-RCNN-50-FPN 的 mAP 从 37.4% 提升到 39.2%,将 Faster-RCNN-X101-FPN 从 41.2% 提升到 42.6%。
- GridMask 将 Cityscapes PSPNet50 的 mIoU 从 77.3% 提升到 78.1%。
- 在 CIFAR-10 上,GridMask 在多种模型上得到更高准确率(例如,ResNet-18 从 95.28% 提升到 96.54%)。
- GridMask 在若干设置上优于 Cutout、HaS 和 AutoAugment,同时增加的计算开销很小。
- 一个反向 GridMask 和结构化丢弃比随机丢弃表现更好,显示出该方法的鲁棒性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。