QUICK REVIEW

[論文レビュー] Defensive Distillation is Not Robust to Adversarial Examples

Nicholas Carlini, David Wagner|arXiv (Cornell University)|Jul 14, 2016

Adversarial Robustness in Machine Learning参考文献 4被引用数 237

ひとこと要約

本論文は、防御的蒸留が adversarial examples に対する頑健性を提供しないことを示す。小さな攻撃の変更により、defensively distilled networks で標的誤分類が成功する（MNIST における 4.7% のピクセル変更で 96.4%）。

ABSTRACT

We show that defensive distillation is not secure: it is no more resistant to targeted misclassification attacks than unprotected neural networks.

研究の動機と目的

Defensive distillation は以前の攻撃の見かけ上の有効性を低下させるが、修正された攻撃には頑健ではない。
T=100 において、修正された攻撃は distilled ネットワークで 96.4% の標的誤分類を達成する。
distilled ネットワークでは、成功させるには平均 36.4 ピクセル（4.7%）の変更が必要で、非 distilled のベースラインでは 45 ピクセル（約 5.86%）である。
適応させた攻撃が、ネットワークの実際の出力を正しくスケーリングしたうえで用いられる場合、温度 1 から 100 までのすべての温度で defensive distillation を打破する。
未保護のネットワークと比較して、強力なテスト攻撃下で蒸留モデルは有意な頑健性の向上を示さない。

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。