Skip to main content
QUICK REVIEW

[論文レビュー] Recent Advances in Adversarial Training for Adversarial Robustness

Tao Bai, Jinqi Luo|arXiv (Cornell University)|Feb 2, 2021
Adversarial Robustness in Machine Learning参考文献 79被引用数 43
ひとこと要約

この調査は、敵対的訓練(AT)による敵対的ロバスト性の向上に関する最近の進展をレビューし、新規の分類法を提示し、一般化の課題を議論し、今後の方向性を概説する。

ABSTRACT

Adversarial training is one of the most effective approaches defending against adversarial examples for deep learning models. Unlike other defense strategies, adversarial training aims to promote the robustness of models intrinsically. During the last few years, adversarial training has been studied and discussed from various aspects. A variety of improvements and developments of adversarial training are proposed, which were, however, neglected in existing surveys. For the first time in this survey, we systematically review the recent progress on adversarial training for adversarial robustness with a novel taxonomy. Then we discuss the generalization problems in adversarial training from three perspectives. Finally, we highlight the challenges which are not fully tackled and present potential future directions.

研究の動機と目的

  • 最新の敵対的訓練手法の概要と、ロバスト性の向上方法を提供する。
  • ATアプローチの新規分類法を導入し、ロバスト性の向上と関連づける。
  • ATにおける一般化のギャップを議論し、課題と今後の研究方向を特定する。

提案手法

  • 最近のAT手法を構造化された分類法に整理・カテゴリ化する(敵対的正則化、カリキュラム、アンサンブル、適応ε、半/無監視、効率的訓練、その他の変種)。
  • 表1の実験結果を要約し、手法とデータセット間のロバスト性と性能のトレードオフを比較する。
  • 標準精度、敵対的ロバスト性、および未知の攻撃における一般化の問題を論じる。
  • min-max最適化と一般化の理論的・実践的な課題を強調し、ATを超えた方向性を示唆する。

実験結果

リサーチクエスチョン

  • RQ1主要な敵対的訓練手法のファミリーは何で、それらは定式化と対象においてどのように異なるのか?
  • RQ2最近のAT手法はデータセットや攻撃ごとにどのように性能を示し、どのような一般化ギャップが残っているのか?
  • RQ3現在のATアプローチの主な制限(例:ミンマックス最適化、過学習、未知の攻撃)と、ATを超えた潜在的方向性は何か?

主な発見

PublicationModel ArchitectureAttackεDatasetAccuracy
Adversarial RegularizationQin et al. (2019)ResNet-152PGD 504/255ImageNet47.00%
Zhang et al. (2019b)Wide ResNetCW 100.031/1CIFAR-1084.03%
Wang et al. (2020)ResNet-18PGD 208/255CIFAR-1055.45%
Kannan et al. (2018)InceptionV3PGD 1016/255ImageNet27.90%
Mao et al. (2019)Wide ResNetPGD 208/255CIFAR-1050.03%
Zhang et al. (2020)Wide ResNetPGD 2016/255CIFAR-1049.86%
Cai et al. (2018)DenseNet-161PGD 78/255CIFAR-1069.27%
Wang et al. (2019)8-Layer ConvNetPGD 208/255CIFAR-1042.40%
Pang et al. (2019)Wide ResNetPGD 100.005CIFAR-10032.10%
Kariyappa and Qureshi (2019)ResNet-20PGD 300.09/1CIFAR-1046.30%
Yang et al. (2020a)ResNet-20PGD 200.01/1CIFAR-1052.4%
Balaji et al. (2019)ResNet-152PGD 10008/255ImageNet59.28%
Ding et al. (2020)Wide ResNetPGD 1008/255CIFAR-1047.18%
Cheng et al. (2020)Wide ResNetPGD 208/255CIFAR-1073.38%
Alayrac et al. (2019)Wide ResNetFGSM8/255CIFAR-1062.18%
Carmon et al. (2019)Wide ResNetPGD 108/255CIFAR-1063.10%
Zhai et al. (2019)Customized ResNetPGD 78/255CIFAR-1042.48%
Hendrycks et al. (2019)Wide ResNetPGD 200.3/1ImageNet50.40%
Shafahi et al. (2019)Wide ResNetPGD 1008/255CIFAR-1046.19%
Wong et al. (2020)ResNet-50PGD 402/255ImageNet43.43%
Andriushchenko and Flammarion (2020)ResNet-50PGD 502/255ImageNet41.40%
Kim et al. (2021)PreActResNet-18FGSM8/255CIFAR-1050.50%
Vivek and Babu (2020b)Wide ResNetPGD 408/255MNIST88.51%
Song et al. (2019)Customized ConvNetPGD 204/255CIFAR-1058.10%
Vivek and Babu (2020a)Wide ResNetPGD 1000.3/1MNIST90.03%
Huang et al. (2020)Wide ResNetPGD 208/255CIFAR-1045.80%
Zhang et al. (2019a)Wide ResNetPGD 208/255CIFAR-1047.98%
Dong et al. (2020)Wide ResNetPGD 208/255CIFAR-10029.40%
Wang and Zhang (2019)Wide ResNetCW 2004/255CIFAR-1060.30%
Zhang and Wang (2019)Wide ResNetPGD 208/255CIFAR-10047.20%
Pang et al. (2020b)Wide ResNetPGD 5008/255CIFAR-1060.75%
Lee et al. (2020)PreActResNet-18PGD 208/255Tiny ImageNet20.31%
Zhang and Xu (2020)Wide ResNetPGD 208/255CIFAR-1045.11%
Madry et al. (2018)ResNet-50PGD 208/255CIFAR-1045.80%
Wang and Zhang (2019)Wide ResNetCW 2004/255CIFAR-1060.30%
Zhang and Xu (2020)Wide ResNetPGD 208/255CIFAR-1045.11%
Pang et al. (2020a)Wide ResNetPGD 5008/255CIFAR-1060.75%
  • 敵対的訓練は依然として最も効果的な防御手段だが、多くのデータセットで敵対的評価下の精度はクリーン精度よりもなお大幅に低い。
  • さまざまなAT手法が存在(正則化、カリキュラム、アンサンブル、適応ε、半/無監視、効率訓練)で、ロバストネスと標準精度の間のトレードオフは手法ごとに異なる。
  • 一般化ギャップ(敵対的に堅牢な一般化と未知の攻撃への一般化)は持続的で、現在のAT技術だけでは完全には解決されていない。
  • 現在の実践はしばしPGDベースの内部最適化に依存しており、正式なロバスト性証明を提供せず、計算コストが高いことがある。
  • 半/無監視データはサンプル効率のギャップを縮小し、ロバスト性を向上させることができるが、保証は依然として限定的。
  • ATを高速化する取り組み(Free-AT、FAST-AT、YOPO)は訓練時間を短縮するのに役立つが、抑制されないと壊滅的過学習のような問題を招くことがある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。