Skip to main content
QUICK REVIEW

[論文レビュー] Reduction of Class Activation Uncertainty with Background Information

H M Dipu Kabir|arXiv (Cornell University)|May 5, 2023
Fault Detection and Control Systems被引用数 8
ひとこと要約

論文はバックグラウンドクラスを導入して汎化を改善し、クラス活性化の不確実性を低減。マルチタスク学習と比較して計算コストを抑えつつ、複数データセットで競争的または最先端の結果を達成。

ABSTRACT

Multitask learning is a popular approach to training high-performing neural networks with improved generalization. In this paper, we propose a background class to achieve improved generalization at a lower computation compared to multitask learning to help researchers and organizations with limited computation power. We also present a methodology for selecting background images and discuss potential future improvements. We apply our approach to several datasets and achieve improved generalization with much lower computation. Through the class activation mappings (CAMs) of the trained models, we observed the tendency towards looking at a bigger picture with the proposed model training methodology. Applying the vision transformer with the proposed background class, we receive state-of-the-art (SOTA) performance on CIFAR-10C, Caltech-101, and CINIC-10 datasets. Example scripts are available in the `CAM' folder of the following GitHub Repository: github.com/dipuk0506/UQ

研究の動機と目的

  • 最終クラススコアにおける背景ノイズへの依存を低減する一般化向上を動機づける。
  • バックグラウンドクラスをマルチタスク学習の軽量な代替手段として提案し、ヘッド層の汎化を向上させる。
  • バックグラウンドクラス訓練がマルチタスク学習よりも低い計算コストでモデル性能を向上させることを示す。
  • バックグラウンドクラスの構築と転移学習・トランスフォーマーとの統合に関するガイドラインを提供する。

提案手法

  • 最終分類ヘッドにバックグラウンドクラスを追加して出力空間を1つ拡張する。
  • 初期層を汎化させつつ、追加のバックグラウンドクラスを用いてヘッドを更新する転移学習で訓練する。
  • ターゲットクラス内容を含まないよう公開データセットからバックグラウンドクラスを生成し、多様な質感とモノクロオプションを確保する。
  • CAMベースの分析を用いて広範な特徴利用を促進し、背景由来の誤分類の感受性を低減する。
  • 転移学習・マルチタスク学習・提案手法のバックグラウンドアプローチを用いて、複数データセット(STL-10、Oxford-102、CUB-200-2011、FGVC Aircraft、KMNIST、EMNIST、CINIC-10、Caltech-101)で評価する。
  • バックグラウンド訓練からの利得を評価するため、ViT-L/16などのトランスフォーマーアーキテクチャとSpinal FCのようなバリアントを試す。

実験結果

リサーチクエスチョン

  • RQ1訓練中にバックグラウンドクラスを追加することで、汎化と diverse データセット間のクラス活性化マッピングの安定化が向上するか。
  • RQ2バックグラウンドクラスアプローチは、精度と計算効率の面で転移学習およびマルチタスク学習とどう比較されるか。
  • RQ3頑健なヘッド層学習のためのバックグラウンドクラス構築のガイドライン(サイズ、内容、多様性)は何が最適か。

主な発見

DatasetModel# EpochTransfer Learn.Multitask Learn.Proposed
STL-10WideResNet-1012098.40 ± 0.1998.42 ± 0.1498.58 ± 0.08
Oxford-102WideResNet-1012098.78 ± 0.2199.03 ± 0.1998.93 ± 0.16
CUB-200-2011Inception-v42083.26 ± 2.3684.93 ± 1.9183.97 ± 1.74
FGVC AircraftInception-v42086.30 ± 1.2085.12 ± 1.6085.91 ± 1.20
KMNISTResNet-181598.14 ± 0.2198.41 ± 0.1598.60 ± 0.12
EMNIST-BalancedResNet-181588.91 ± 1.2589.24 ± 1.4290.04 ± 1.08
  • バックグラウンドクラス訓練は標準的な転移学習より高い精度を示し、しばしばマルチタスク学習をわずかに上回る一方で訓練時間を大幅に短縮する。
  • バックグラウンドクラスを用いたトランスフォーマー系モデルは、報告実験において複数のデータセットでSOTA様の結果を達成している(例:STL-10、CINIC-10)。
  • バックグラウンドデータを含めることでヘッド層が広い空間領域の特徴を一般化できるようになり、背景アーティファクトへの依存を減少させる。
  • バックグラウンドクラスの構築には公開データセットを利用し、初期層を凍結せずにエンドツーエンド訓練を可能にする。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。