Skip to main content
QUICK REVIEW

[論文レビュー] Learning multiple visual domains with residual adapters

Sylvestre-Alvise Rebuffi, Hakan Bilen|arXiv (Cornell University)|May 22, 2017
Domain Adaptation and Few-Shot Learning参考文献 1被引用数 126
ひとこと要約

残差アダプタを用いたモジュールを提案し、単一のネットワークで十を超える多様な視覚ドメインにわたり良好な性能を達成できるようにする。Visual Decathlon ベンチマークを導入し、マルチドメイン表現を評価する。

ABSTRACT

There is a growing interest in learning data representations that work well for many different types of problems and data. In this paper, we look in particular at the task of learning a single visual representation that can be successfully utilized in the analysis of very different types of images, from dog breeds to stop signs and digits. Inspired by recent work on learning networks that predict the parameters of another, we develop a tunable deep network architecture that, by means of adapter residual modules, can be steered on the fly to diverse visual domains. Our method achieves a high degree of parameter sharing while maintaining or even improving the accuracy of domain-specific representations. We also introduce the Visual Decathlon Challenge, a benchmark that evaluates the ability of representations to capture simultaneously ten very different visual domains and measures their ability to recognize well uniformly.

研究の動機と目的

  • 複数の視覚ドメイン間でパラメータを共有しつつ、ドメイン特化の適応を可能にするニューラルアーキテクチャを開発する。
  • 小さな数のドメイン特異パラメータを追加する残差アダプタモジュールを導入する。
  • 新しいドメインを追加しても忘れずに学習できるようにする。
  • Visual Decathlon ベンチマークを通じて十の多様な視覚データセットで手法を評価する。

提案手法

  • 残差ブロックに追加する小さな1x1フィルタバンクとして残差アダプタモジュールを導入し、最小限のパラメータ増加でドメイン特有の適応を可能にする。
  • パラメータをドメイン非依存(共有)とドメイン特異(適応)の成分に分割する。
  • 低ランクまたは1x1フィルタベースのパラメータ化を用いて、ドメイン特異パラメータを小さく保つ(各ドメインあたり約2(C^2+5C))。
  • バッチ正規化のスケーリングとバイアスパラメータを追加のドメイン依存コンポーネントとして組み込む。
  • ImageNetで事前学習を行い、各ドメインごとにアダプタを訓練して、忘却なしに学習を可能にすることでマルチドメイン学習をブーストする。
  • トレーニング中に全ドメインのデータを循環させて共同学習を行い、共有パラメータを精練することでエンドツーエンド学習をオプションで有効にする。

実験結果

リサーチクエスチョン

  • RQ1非常に異なる視覚ドメインにわたって、コンパクトなドメイン特異アダプタパラメータの集合は効果的なマルチドメイン学習を可能にするか?
  • RQ2提案された残差アダプタ手法は、標準的なファインチューニング、特徴量のフリーズ、その他のベースラインと比較して、単一モデルのマルチドメイン性能においてどうか。
  • RQ3複数のターゲットドメインへ適応しつつ、元の大規模ソースドメイン(例: ImageNet)での性能を維持できるか。
  • RQ4アダプタのサイズ、正則化、およびドメイン予測精度が全体のマルチドメイン性能に与える影響は何か。
  • RQ5Visual Decathlon ベンチマークはマルチドメイン表現の長所と短所をどのように示すか。

主な発見

モデル#par.ImNetAirc.C100DPedDTDGTSRFlwrOGltSVHNUCF平均S# 画像
Scratch10×59.8757.1075.7391.2037.7796.5556.3088.7496.6343.2770.321625Scratch
Scratch+11×59.6759.5976.0892.4539.6396.9056.6688.7496.7844.1771.071826Scratch+
Feature extractor59.6723.3163.1180.3345.3768.1673.6958.7943.5426.8054.28544Feature extractor
Finetune10×59.8760.3482.1292.8255.5397.5381.4187.6996.5551.2076.512500Finetune
LwF [21]10×59.8761.1582.2392.3458.8397.5783.0588.0896.1050.0476.932515LwF [21]
BN adapt. [5]∼1×59.8743.0578.6292.0751.6095.8274.1484.8394.1043.5171.761363BN adapt. [5]
Res. adapt.59.6756.6881.2093.8850.8597.0566.2489.6296.1347.4573.882118Res. adapt.
Res. adapt. decay59.6761.8781.2093.8857.1397.5781.6789.6296.1350.1276.892621Res. adapt. decay
Res. adapt. finetune all59.2363.7381.3193.3057.0297.4783.4389.8296.1750.2877.172643Res. adapt. finetune all
Res. adapt. dom-pred2.5×59.1863.5281.1293.2954.9397.2082.2989.8295.9950.1076.742503Res. adapt. dom-pred
Res. adapt. (large)∼12×67.0067.6984.6994.2859.4197.4384.8689.9296.5952.3979.433131Res. adapt. (large)
  • 残差アダプタは、十のドメインにまたがる強力なドメイン特化性能を保ちつつ、高いパラメータ共有を実現する。
  • この手法は、全パラメータをファインチューニングする baselines や別モデルを訓練する場合と比べて、平均精度が競争力があり、デカスロンスコアが有利である。
  • アダプタベースの手法は、元のドメインの忘却を示さず、ターゲットドメインで良好な性能を発揮する。
  • アダプタパラメータのみを調整するだけで、いくつかのドメインで全ファインチューニングや他のベースラインよりも優れる。
  • エンドツーエンド学習とドメイン予測には追加の利点があり、元のドメインでのパフォーマンス低下を最小限に抑えつつ高い結果を達成する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。