Skip to main content
QUICK REVIEW

[論文レビュー] A Fourier Perspective on Model Robustness in Computer Vision

Dong Yin, Raphael Gontijo Lopes|arXiv (Cornell University)|Jun 21, 2019
Adversarial Robustness in Machine Learning参考文献 24被引用数 84
ひとこと要約

本論文はフーリエ解析を用いてデータ拡張と敵対的学習によるロバスト性のトレードオフを説明し、これらの手法がモデルを低周波特徴に偏らせることを示し、AutoAugment が CIFAR-10-C と ImageNet-C で顕著なロバスト性向上を実証する。

ABSTRACT

Achieving robustness to distributional shift is a longstanding and challenging goal of computer vision. Data augmentation is a commonly used approach for improving robustness, however robustness gains are typically not uniform across corruption types. Indeed increasing performance in the presence of random noise is often met with reduced performance on other corruptions such as contrast change. Understanding when and why these sorts of trade-offs occur is a crucial step towards mitigating them. Towards this end, we investigate recently observed trade-offs caused by Gaussian data augmentation and adversarial training. We find that both methods improve robustness to corruptions that are concentrated in the high frequency domain while reducing robustness to corruptions that are concentrated in the low frequency domain. This suggests that one way to mitigate these trade-offs via data augmentation is to use a more diverse set of augmentations. Towards this end we observe that AutoAugment, a recently proposed data augmentation policy optimized for clean accuracy, achieves state-of-the-art robustness on the CIFAR-10-C benchmark.

研究の動機と目的

  • 視覚領域における分布のシフトがモデルの頑健性に与える影響を調査し、破損の周波数成分に焦点を当てる。
  • 一般的なデータ拡張と敵対的訓練によって生じる頑健性のトレードオフを説明する。
  • 拡張によるバイアスが高周波と低周波の入力特徴への依存度にどう影響するかを特徴づける。
  • 破損全般の頑健性を向上させる代替拡張戦略(AutoAugment)を評価する。

提案手法

  • 画像と破損に対して2Dフーリエ変換を定義し適用する。
  • 高周波・低周波透過フィルタリングおよびフーリエ基底摂動を用いて周波数特異的な摂動を作成する。
  • 自然訓練モデル、Gaussian 拡張、敵対的訓練、AutoAugment モデルを破損ベンチマーク全体で比較する。
  • CIFAR-10-CおよびImageNet-Cを横断して、テスト精度と破損誤差指標(mCE)で頑健性を定量化する。
  • 攻撃下での周波数成分を理解するため、フーリエ領域における敵対的摂動を分析する。

実験結果

リサーチクエスチョン

  • RQ1Gaussianデータ拡張と敵対的訓練は、異なる周波数の破損に対するモデルの頑健性にどう影響するか。
  • RQ2周波数ベースの視点は、高周波・低周波の破損にまたがる観測された頑健性のトレードオフを説明できるか。
  • RQ3より多様な拡張方針(AutoAugment)は、単一戦略の拡張よりも広い頑健性をもたらすか。
  • RQ4自然訓練モデルと敵対的訓練モデルにおける敵対的摂動の周波数的挙動はどうなるか。

主な発見

  • Gaussian拡張と敵対的訓練は、モデルを低周波情報へ偏らせ、高周波の破損に対する頑健性を向上させる一方で、低周波の破損とクリーン精度を損なう。
  • 低周波および高周波の摺動(摂動)は、モデル間で異なる頑健性パターンを示す。フロントエンドのフィルタリングは周波数バイアス効果を裏付ける。
  • AutoAugmentはCIFAR-10-Cで最も高い平均破損精度と最良のmCEを達成し、多くの破損で自然訓練、Gaussian、敵対訓練を上回る。
  • 自然訓練モデルの敵対摂動は高周波に集中する一方、敵対的訓練モデルは摂動の周波数が自然データに近い。
  • 高周波成分の摂動は、内容を保持するフーリエ基底攻撃で精度を壊滅的に低下させる可能性があり、セキュリティ上の弱点を示す。
  • 頑健性の移転を予測する普遍的な周波数ベースの指標は存在しない。いくつかの低周波拡張は fog/コントラストの頑健性を低下させる一方、加法ノイズの頑健性を改善することがある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。