Skip to main content
QUICK REVIEW

[論文レビュー] Deep Defense: Training DNNs with Improved Adversarial Robustness

Ziang Yan, Yiwen Guo|arXiv (Cornell University)|Feb 23, 2018
Adversarial Robustness in Machine Learning参考文献 8被引用数 52
ひとこと要約

Deep Defenseは、分類器の学習目的に統合された摂動ベースの正則化項を導入し、 benignデータに対する精度を維持しつつ、敵対的攻撃に対するDNNの堅牢性を向上させる。

ABSTRACT

Despite the efficacy on a variety of computer vision tasks, deep neural networks (DNNs) are vulnerable to adversarial attacks, limiting their applications in security-critical systems. Recent works have shown the possibility of generating imperceptibly perturbed image inputs (a.k.a., adversarial examples) to fool well-trained DNN classifiers into making arbitrary predictions. To address this problem, we propose a training recipe named "deep defense". Our core idea is to integrate an adversarial perturbation-based regularizer into the classification objective, such that the obtained models learn to resist potential attacks, directly and precisely. The whole optimization problem is solved just like training a recursive network. Experimental results demonstrate that our method outperforms training with adversarial/Parseval regularizations by large margins on various datasets (including MNIST, CIFAR-10 and ImageNet) and different DNN architectures. Code and models for reproducing our results are available at https://github.com/ZiangYan/deepdefense.pytorch

研究の動機と目的

  • セキュリティクリティカルタスクにおける敵対的脆弱性に対処することによって、堅牢なDNNを動機づける。
  • 敵対的事例から直接学習する摂動ベース正則化項を提案する。
  • 攻撃者への耐性を高めつつ、 benignデータの精度を維持または向上させる。
  • 効率的な最適化を可能にする微分可能でネットワークベースの定式化を提供する。

提案手法

  • 敵対的摂動のノルムを罰する正則化目的関数を定式化する。
  • Delta_xを計算するため、DeepFoolに基づくモジュールを用いて敵対的摂動を近似する。
  • 摂動計算を逆伝播/再帰的ネットワークとして表現し、共同最適化を行う。
  • 攻撃が難しい正しく分類されたサンプルを強調する指数型関数Rを用いる。
  • 正しく分類されたサンプルと誤分類サンプルをサンプル固有の重みづけでバランスを取り、頑健性と精度を調整する。
  • アーキテクチャ間の転移性を評価するため、スクラッチから訓練するのではなく既存モデルを細調整する。

実験結果

リサーチクエスチョン

  • RQ1訓練時に摂動ベースの正則化項を導入することで、標準データセットとアーキテクチャ全体にわたり敵対攻撃への頑健性が向上するか。
  • RQ2Deep Defenseは、MNIST・CIFAR-10・ImageNetで benignセットの精度を損なうことなく頑健性を向上させることができるか。
  • RQ3DeepFoolやFGSのような強力な攻撃に対して、 adversarial training および Parseval training と比較して方法の差はどうか。
  • RQ4ハイパーパラメータと層別正則化が頑健性と精度に与える影響。
  • RQ5大規模ネットワークとデータセットへスケール可能で、計算的に妥当か。

主な発見

DatasetNetworkMethodAcc.ρ2Acc.@ 0.2ε_refAcc.@ 0.5ε_refAcc.@ 1.0ε_ref
MNISTMLPReference98.31%1.11e-172.76%29.08%3.31%
MNISTMLPPar. Train98.32%1.11e-177.44%28.95%2.96%
MNISTMLPAdv. Train I98.49%1.62e-187.70%59.69%22.55%
MNISTMLPOurs98.65%2.25e-195.04%88.93%50.00%
MNISTLeNetReference99.02%2.05e-190.95%53.88%19.75%
MNISTLeNetPar. Train99.10%2.03e-191.68%66.48%19.64%
MNISTLeNetAdv. Train I99.18%2.63e-195.20%74.82%41.40%
MNISTLeNetOurs99.34%2.84e-196.51%88.93%50.00%
CIFAR-10ConvNetReference79.74%2.59e-261.62%37.84%23.85%
CIFAR-10ConvNetPar. Train80.48%3.42e-269.19%50.43%22.13%
CIFAR-10ConvNetAdv. Train I80.65%3.05e-265.16%45.03%35.53%
CIFAR-10ConvNetOurs81.70%5.32e-272.15%59.02%50.00%
CIFAR-10NINReference89.64%4.20e-275.61%49.22%33.56%
CIFAR-10NINPar. Train88.20%4.33e-275.39%49.75%17.74%
CIFAR-10NINAdv. Train I89.87%5.25e-278.87%58.85%45.90%
CIFAR-10NINOurs89.96%5.58e-280.70%70.73%50.00%
ImageNetAlexNetReference56.91%2.98e-354.62%51.39%46.05%
ImageNetAlexNetOurs57.11%4.54e-355.79%53.50%50.00%
ImageNetResNetReference69.64%1.63e-363.39%54.45%41.70%
ImageNetResNetOurs69.66%2.43e-365.53%59.46%50.00%
  • Deep Defenseは、MNIST, CIFAR-10, ImageNet全体で、堅牢性指標で競合他手法を一貫して上回りつつ、 benign精度を維持または向上させる。
  • MNISTでは、Ourは98.65%の benign精度を達成、Referenceの98.31%に対し、DeepFoolとFGS攻撃に対してははるかに高い頑健性。
  • LeNetでは、Ourは benign accuracyを99.34%に引き上げ、Adversarial/Parsevalベースラインよりも強力な頑健性を達成。
  • CIFAR-10 (ConvNet, NIN)でbenign精度を高く、頑健性も著しく向上。例: Acc.@1.0ε_refは両ネットで50.00%。
  • ImageNet (AlexNet, ResNet)では、 benign精度の向上は控えめだが、DeepFool頑健性は約1.5倍向上。
  • 指數重み付けRを用いたハイブリッド正則化は、脆弱で正しく分類されたサンプルに頑健性の焦点を当て、全体性能を損なわない。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。