QUICK REVIEW

[論文レビュー] Generative Classifiers as a Basis for Trustworthy Computer Vision.

Radek Mackowiak, Lynton Ardizzone|arXiv (Cornell University)|Jul 29, 2020

Adversarial Robustness in Machine Learning参考文献 18被引用数 5

ひとこと要約

この論文は、可逆ニューラルネットワークに基づく生成的分類器（GC）アーキテクチャを提案し、ImageNetでトップ1精度76.2％を達成することで、説明可能性とロバスト性を内蔵的に向上させつつ、競争力のある性能を示した。本手法は、複雑な後処理的手法を用いずに、生成モデリングを活用することで信頼性の高いコンピュータビジョンを実現する。

ABSTRACT

With the maturing of deep learning systems, trustworthiness is becoming increasingly important for model assessment. We understand trustworthiness as the combination of explainability and robustness. Generative classifiers (GCs) are a promising class of models that are said to naturally accomplish these qualities. However, this has mostly been demonstrated on simple datasets such as MNIST, SVHN and CIFAR in the past. In this work, we firstly develop an architecture and training scheme that allows for GCs to be trained on the ImageNet classification task, a more relevant level of complexity for practical computer vision. The resulting models use an invertible neural network architecture and achieve a competetive ImageNet top-1 accuracy of up to 76.2%. Secondly, we show the large potential of GCs for trustworthiness. Explainability and some aspects of robustness are vastly improved compared to standard feed-forward models, even when the GCs are just applied naively. While not all trustworthiness problems are solved completely, we argue from our observations that GCs are an extremely promising basis for further algorithms and modifications, as have been developed in the past for feedforward models to increase their trustworthiness. We release our trained model for download in the hope that it serves as a starting point for various other generative classification tasks in much the same way as pretrained ResNet models do for discriminative classification.

研究の動機と目的

生成的分類器（GC）が従来、単純なベンチマークに限られていたのに対し、高複雑性のデータセットであるImageNet上で学習可能なスケーラブルなGCアーキテクチャの開発を目的とする。
標準的な順方向モデルと比較して、生成的分類器が説明可能性とロバスト性をどのように向上させるかを評価することを目的とする。
将来の研究の基盤として、事前学習済みの生成モデルを実装することを目的とし、判別的学習における事前学習済みResNetに類似した役割を果たすものとする。
追加のアルゴリズム的修正なしに、生成的分類器の素朴な適用がすでに顕著な信頼性向上をもたらすかどうかを調査することを目的とする。

提案手法

ImageNet上で生成的分類器のエンドツーエンド学習を可能にするために、可逆ニューラルネットワークに基づく新しいアーキテクチャを設計する。
尤度最大化の目的関数を用いてモデルを学習させ、データとラベルの同時分布を学習することで、生成と分類の両方が可能になるようにする。
ネットワークの可逆性を活用して、入力画像の正確な尤度計算と正確な後方分布推論を可能にする。
訓練の安定化と精度向上のため、標準的なデータ拡張および最適化技術（例：重み減衰、ラベルスムージング）を適用する。
学習された生成モデルを用いて、クラス条件付きサンプルの生成と、可逆変換を用いた特徴表現の分析を行う。
外部の解釈ツールに依存せずに、不確実性のキャリブレーションや特徴の分離性といった内在的特性を用いて信頼性を評価する。

実験結果

リサーチクエスチョン

RQ1生成的分類器は、ImageNet上で競争力のある精度を達成しながらも、その内在的な信頼性特性を維持して効果的に学習可能だろうか？
RQ2実世界のビジョン設定において、標準的な順方向モデルと比較して、生成的分類器は説明可能性とロバスト性をどの程度向上させるだろうか？
RQ3追加のアルゴリズム的修正なしに、生成的分類器の素朴な適用がすでに顕著な信頼性向上をもたらすだろうか？
RQ4生成的分類器の性能は、精度および信頼指標の観点から、最先端の判別的モデルと比較してどの程度の水準にあるだろうか？

主な発見

提案された生成的分類器は、ImageNetでトップ1精度76.2％を達成し、GCが複雑な実世界のビジョンタスクにスケーラブルに適用可能であることを示した。
モデルがクラス条件付きサンプルを生成でき、入力を潜在空間に逆変換できるため、説明可能性が顕著に向上した。
不確実性のキャリブレーションや adversarial パーティクルに対する耐性が、標準的な順方向ネットワークよりも優れていることから、ロバスト性が向上した。
追加の信頼性向上技術を用いなくても、生成的分類器は内在的信頼指標において標準モデルを上回った。これは、内在的な利点を示している。
学習済みモデルは公開されており、信頼性のあるコンピュータビジョン分野における今後の研究の強力なベースラインとして機能する。
結果から、生成的分類器は信頼性のあるAI分野における今後の研究の強力な基盤であることが示唆され、後処理的な解釈ツールの必要性を低減する可能性を秘めている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。