QUICK REVIEW

[論文レビュー] High Dimensional Spaces, Deep Learning and Adversarial Examples

Simant Dube|arXiv (Cornell University)|Jan 2, 2018

Adversarial Robustness in Machine Learning参考文献 17被引用数 23

ひとこと要約

この論文は、高次元空間における深層学習の厳密な数学的分析を提供し、 adversarial examples がモデルの欠陥ではなく、画像多様体の幾何的性質に起因することを示している。先行研究における誤った議論を是正し、L₂ adversarial perturbations が解像度 n とともに O(1/√n) のオーダーで縮小することを証明し、意味的構造と低次元多様体をモデル化することで adversarial examples を排除する parts-whole manifold learning フレームワークを提案している。

ABSTRACT

In this paper, we analyze deep learning from a mathematical point of view and derive several novel results. The results are based on intriguing mathematical properties of high dimensional spaces. We first look at perturbation based adversarial examples and show how they can be understood using topological and geometrical arguments in high dimensions. We point out mistake in an argument presented in prior published literature, and we present a more rigorous, general and correct mathematical result to explain adversarial examples in terms of topology of image manifolds. Second, we look at optimization landscapes of deep neural networks and examine the number of saddle points relative to that of local minima. Third, we show how multiresolution nature of images explains perturbation based adversarial examples in form of a stronger result. Our results state that expectation of $L_2$-norm of adversarial perturbations is $O\left(\frac{1}{\sqrt{n}} ight)$ and therefore shrinks to 0 as image resolution $n$ becomes arbitrarily large. Finally, by incorporating the parts-whole manifold learning hypothesis for natural images, we investigate the working of deep neural networks and root causes of adversarial examples and discuss how future improvements can be made and how adversarial examples can be eliminated.

研究の動機と目的

高次元幾何学とトポロジーを用いた数学的厳密な説明を通じて、adversarial examples の原因をモデル固有の振る舞いではなく、高次元空間における幾何的性質に求める。
特に高次元空間における深層ニューラルネットワークの最適化の様相を分析し、鞍点と局所最小値の比を調査する。
多スケール画像構造を用いて、摂動に基づく adversarial examples が高解像度画像では本質的に小さいことを説明する。
意味的構造と低次元多様体をモデル化することで adversarial examples を排除できる parts-whole manifold learning 偽説を提唱する。
画像部品のポーズに注意を払う低次元表現を統合することで、生成的・判別的学習を統合し、今後の深層学習の改善を導く。

提案手法

高次元空間における位相的・幾何的議論を用い、画像多様体の構造と境界に焦点を当てて adversarial examples を分析する。
多スケール画像の性質を用いて、一般化された数学的結果を導出し、adversarial perturbations の期待 L₂-ノルムが O(1/√n) のオーダーでスケーリングすることを示す。ここで n は画像解像度である。
Goodfellow ら（2015年）の主張における論理的欠陥を特定・是正する。すなわち、次元が増加しても L∞-ノルムの摂動が小さくなるという主張は、ターゲット値とベクトルノルムが次元に依存しないという誤った仮定に基づいていることを示す。
各層が部分と全体をポーズパラメータを用いてモデル化する階層的・低次元多様体学習フレームワークを提案し、生成的・判別的目的を統合する。
真値のポーズラベルを明示的に与えるか、キャプセルのような注目メカニズムを介して暗黙的に与えることで、ネットワークが完全な教師信号なしに意味的構造を学習できるハイブリッドトレーニングアプローチを導入する。
判別的損失、生成的損失、ポーズパラメータに対する回帰損失を組み合わせて、多様体間を点を写像するニューロンを訓練する。この際、意味的意味を保持する。

実験結果

リサーチクエスチョン

RQ1なぜ adversarial examples が深層ニューラルネットワークに存在するのか。それらの存在は、モデル固有の振る舞いではなく、高次元幾何学によって説明可能なのか。
RQ2Goodfellow ら（2015年）の広く引用されている主張における欠陥は何か。すなわち、次元が増加することで L∞-ノルムの摂動が小さくなるという主張は、なぜ誤りなのか。
RQ3L₂-ノルムの摂動の期待値は、画像解像度 n に対してどのようにスケーリングするのか。これにより adversarial robustness にどのような含意が生じるのか。
RQ4自然画像の多スケール構造は、adversarial perturbations の発生または制限にどのような役割を果たすのか。
RQ5部分と全体の多様体学習に基づく深層学習アーキテクチャは、意味的構造と低次元多様体をモデル化することで、adversarial examples を排除できるのか。

主な発見

Goodfellow ら（2015年）の主張における根本的欠陥を特定した。次元が増加してもターゲット活性化値が一定であるという仮定は誤りであり、ベクトルノルムと距離は次元に依存して変化するためである。
adversarial perturbations の期待 L₂-ノルムが O(1/√n) のオーダーでスケーリングすることを証明した。これは、画像解像度 n が増加するにつれて摂動がゼロに収束することを意味し、高解像度では adversarial examples がますます稀になることを示している。
高次元空間では、多様体上のほとんどすべての点がその表面に近い。したがって、adversarial examples は異常ではなく、表面の複雑さと高次元の余次元の結果として自然に生じる。
深層ネットワークの最適化の様相には、特に高次元帯において、局所最小値よりも指数関数的に多くの鞍点が存在する。これは、局所最小値が主な障害ではないという主張を支持する。
ポーズパラメータを明示的または暗黙的に学習する parts-whole manifold learning フレームワークは、意味的構造をモデル化し、各層での次元を低く保つことでモデルの複雑さを低減できる。
将来の深層ネットワークは、ポーズとシーンパラメータの生成的モデリングと判別的分類を統合することで、意味的で意味のある低次元多様体を学習し、adversarial examples を完全に排除できる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。