QUICK REVIEW

[論文レビュー] Confidence estimation in Deep Neural networks via density modelling

Akshayvarun Subramanya, Suraj Srinivas|arXiv (Cornell University)|Jul 21, 2017

Adversarial Robustness in Machine Learning参考文献 14被引用数 33

ひとこと要約

この論文は、画像の歪み（ノイズ、ぼかし、JPEG圧縮、敵対的摂動など）の下で、ソフトマックスが失敗するのに対し、単調に減少する信頼度スコアを生成する、密度モデリングに基づく深層ニューラルネットワークの信頼度推定手法を提案している。この手法は、予測の不確実性を推定するために対角ガウス分布を用い、信頼性の高い予測の検出において優れたロバストネスを示している。

ABSTRACT

State-of-the-art Deep Neural Networks can be easily fooled into providing incorrect high-confidence predictions for images with small amounts of adversarial noise. Does this expose a flaw with deep neural networks, or do we simply need a better way to estimate confidence? In this paper we consider the problem of accurately estimating predictive confidence. We formulate this problem as that of density modelling, and show how traditional methods such as softmax produce poor estimates. To address this issue, we propose a novel confidence measure based on density modelling approaches. We test these measures on images distorted by blur, JPEG compression, random noise and adversarial noise. Experiments show that our confidence measure consistently shows reduced confidence scores in the presence of such distortions - a property which softmax often lacks.

研究の動機と目的

画像の歪みや敵対的ノイズの下でも過剰に自信を持つ予測を生成する深層ニューラルネットワークにおける深刻な欠陥を是正すること。
ソフトマックスを越えて密度モデリングのアプローチを用いることで、信頼度推定を改善できるかどうかを調査すること。
画像品質が低下するにつれて信頼度スコアが一貫して単調に減少するような手法を開発すること。
多様な歪みおよび敵対的例に対して提案手法を評価し、ソフトマックスと比較して優れたロバストネスを示すことを目的とする。
密度ベースの信頼度推定が、ソフトマックスと比較して実際のモデル精度とより良好に相関することを実証的に示すこと。

提案手法

信頼度推定を密度モデリング問題として定式化し、ソフトマックスではなく確率的モデルを用いて予測分布 P(y|X) を推定する。
事前ソフトマックス活性化 z を対角共分散行列をもつ多変量ガウス分布としてモデル化し、この分布における尤度を用いて不確実性を推定する。
推定されたガウスモデルにおける真のクラスの尤度を信頼度として計算し、クラス間で正規化する。
適合したガウス分布における真のクラスラベルの対数尤度を信頼度として用い、入力の摂動に敏感であることを保証する。
標準的な交差エントロピー損失を用いてエンドツーエンドでモデルを学習し、推論時に密度モデルを適用して信頼度を推定する。
クリーンな画像が基準となる信頼度値（例：1.0）をとるように信頼度スコアをスケーリングし、可視化および比較に用いる。

実験結果

リサーチクエスチョン

RQ1画像の歪みの下で、密度モデリングはソフトマックスに比べてより信頼性の高い信頼度推定を可能にするか？
RQ2ノイズ、ぼかし、または圧縮による画像品質の低下に伴い、提案手法が一貫して単調に減少する信頼度プロファイルを示すか？
RQ3敵対的例の検出において、提案された信頼度測定はソフトマックスと比較してどうなるか？
RQ4なぜソフトマックスは摂動の下で信頼度を低下させないのか？これは活性化のスケールに敏感であることに起因するのか？
RQ5高次元入力空間における性能に影響を与える密度モデルの選択（例：対角ガウス）の程度はどの程度か？

主な発見

提案された密度ベースの信頼度測定は、ガウスノイズとぼかしが増加する条件下で一貫して単調に減少するが、ソフトマックスは高歪み下でも信頼度を低下させない。
MNISTデータセットでは、提案手法はノイズが増加する（σ = 0 から 1）につれて一貫して信頼度が低下するが、ソフトマックスは高いままかつ不安定である。
ImageNetでは、ガウスぼかし（σ = 0 から 36）の下で信頼度が低下することを検出できるが、MNISTほど一貫性はなく、高次元密度推定における課題を示唆している。
JPEG圧縮の下では、ソフトマックスと提案手法の両方とも品質因子が低下するにつれて信頼度が減少するが、提案手法はより信頼性の高いプロファイルを維持している。
ImageNet検証セットからの敵対的例において、提案手法は5,795件中2,214件で正しく信頼度を低下させられなかったが、ソフトマックスは5,795件すべてで失敗しており、顕著な改善が確認された。
提案手法の信頼度スコア（正規化されていない）は、クリーンな画像から歪んだ画像に至るまで一貫して低下するが、ソフトマックスのスコアはほとんど変化せず、特に敵対的ケースでは逆に上昇する傾向がある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。