Skip to main content
QUICK REVIEW

[論文レビュー] Torchattacks: A PyTorch Repository for Adversarial Attacks

Hoki Kim|arXiv (Cornell University)|Sep 24, 2020
Adversarial Robustness in Machine Learning参考文献 16被引用数 102
ひとこと要約

Torchattacks は、 adversarial attack algorithms を実装する PyTorch ライブラリで、敵対的サンプルを生成しモデルの頑健性を評価するための使用方法と実装の詳細を提供します。

ABSTRACT

Torchattacks is a PyTorch library that contains adversarial attacks to generate adversarial examples and to verify the robustness of deep learning models. The code can be found at https://github.com/Harry24k/adversarial-attacks-pytorch.

研究の動機と目的

  • 対向攻撃に対して深層学習モデルの頑健な評価を動機づけ、実行可能にする。
  • 実装された adversarial attacks の包括的なリストとそれらのアルゴリズムの詳細を提供する。
  • PyTorch モデルとデータパイプライン内で攻撃を適用するための実践的ガイダンスを提供する。

提案手法

  • L0、L2、または L_infinity ノルムの epsilon-ボール内の摂動を最適化する形式として攻撃を記述する。
  • FGSM、BIM、CW、R+FGSM、PGD、EOT+PGD、TPGD、FFGSM、MI-FGSM、および MultiAttack を含むコア攻撃を実装する。
  • 各攻撃のステップごとのアルゴリズム方程式と、それらの PyTorch 実装パラメータ(model、eps、steps など)を提示する。
  • モード制御、出力タイプ、敵対的サンプルの保存、MultiAttack による攻撃の組み合わせなどの使用ユーティリティと統一された Attack クラスを導入する。

実験結果

リサーチクエスチョン

  • RQ1Torchattacks に実装されている adversarial attacks はどれで、それらは数学的にどのように定式化されるか?
  • RQ2ユーザーはこれらの攻撃をどのように適用して PyTorch ワークフロー内で敵対的サンプルを生成できるか?
  • RQ3攻撃モード、出力、および攻撃の組み合わせを管理するために Torchattacks はどのようなユーティリティを提供するか?

主な発見

  • PyTorch で実装された複数の著名な adversarial attacks のライブラリで、明示的な式と実装例を含む。
  • モデルを攻撃する際の注意事項と入力/出力の形状要件が明確に文書化されている。
  • Attack クラスのメソッドや攻撃を組み合わせる MultiAttack を含む実用的な使用ガイダンス。
  • 例は、典型的なパラメータ設定で攻撃をインスタンス化する方法(例:FGSM、BIM、CW)を示している。
  • RFGSM、PGDL2、EOTPGD、TPGD、FFGSM、MIFGSM など、多様な攻撃系のバリアントをサポートしている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。