[論文レビュー] Transferrable Prototypical Networks for Unsupervised Domain Adaptation
本論文は、Transferrable Prototypical Networks (TPN) を提案し、ソースドメインとターゲットドメイン間でクラスプロトタイプを整合させ、スコア分布を同期させる。MNIST/USPS/SVHN を含む複数のドメインシフトで最先端の結果を達成する。VisDA 2017。
In this paper, we introduce a new idea for unsupervised domain adaptation via a remold of Prototypical Networks, which learn an embedding space and perform classification via a remold of the distances to the prototype of each class. Specifically, we present Transferrable Prototypical Networks (TPN) for adaptation such that the prototypes for each class in source and target domains are close in the embedding space and the score distributions predicted by prototypes separately on source and target data are similar. Technically, TPN initially matches each target example to the nearest prototype in the source domain and assigns an example a "pseudo" label. The prototype of each class could then be computed on source-only, target-only and source-target data, respectively. The optimization of TPN is end-to-end trained by jointly minimizing the distance across the prototypes on three types of data and KL-divergence of score distributions output by each pair of the prototypes. Extensive experiments are conducted on the transfers across MNIST, USPS and SVHN datasets, and superior results are reported when comparing to state-of-the-art approaches. More remarkably, we obtain an accuracy of 80.4% of single model on VisDA 2017 dataset.
研究の動機と目的
- 転送可能な埋め込み空間でプロトタイプネットワークを活用し、教師なしのドメイン適応を動機付ける。
- ソースとターゲットの表現を整合させるクラスレベルおよびサンプルレベルのドメイン不整合削減を導入する。
- ラベル付きソースデータと偽ラベル付きのターゲットデータを用いたエンドツーエンド訓練を可能にする。
- 数字データセットと合成→実データ転送を含む強力な実証性能を示す。
提案手法
- プロトタイプネットワークの枠組みを用いて入力を共有空間に埋め込む。
- クラスプロトタイプをソースのみ、ターゲットのみ(偽ラベル付き)、およびソース-ターゲットデータで別々に計算する。
- RKHS 内でプロトタイプを整合させるクラスレベルの不整合損失を最小化する。
- 異なるドメイン固有の分類器からの各サンプルのスコア分布間の対称Kullback–Leibler散布を用いてサンプルレベルの不整合損失を最小化する。
- 監督付きのソース分類損失と一般目的およびタスク固有の適応項を用いたエンドツーエンド訓練を行い、ソースプロトタイプとターゲット/結合プロトタイプの更新を交互に行う;信頼度のチェックを伴うターゲットサンプルには偽ラベルを使用する。
- ターゲットを埋め込み空間に射影して、格納されたプロトタイプとの距離で分類することで推定/評価を行う。
実験結果
リサーチクエスチョン
- RQ1異なるドメインのプロトタイプを共有埋め込み空間で整合させ、クラスレベルのドメインシフトを低減できるか。
- RQ2ターゲットサンプルを効果的に偽ラベル付けして、ラベルなしターゲットデータからターゲットドメインのプロトタイプを作成できるか。
- RQ3ドメイン固有の分類器間のスコア分布の類似性を強制することは、プロトタイプ整合を超えてターゲットドメインの精度を改善するか。
- RQ4一般目的(クラスレベル)とタスク固有(サンプルレベル)適応の組み合わせが、教師なしドメイン適応の性能にどのような影響を与えるか。
主な発見
- TPN は digits 転送で 92.1%(M→U)および 94.1%(U→M)の精度を達成し、いくつかの最先端手法を上回る。
- TPN は S→M 転送で 93.0% の精度を達成し、ADDA、JAN、MCD などを凌駕する。
- VisDA 2017 の合成→実データ転送では、単一モデルで 80.4% の精度を達成。
- バリアントのアブレーションにより、一般目的(TPN gen)とタスク固有(TPN task)の適応がどちらも寄与し、TPN は通常、ソースのみに基づく手法や多くのベースラインより上回る。
- 偽ラベルノイズに対する頑健性を示し、自己ラベリングの反復を通じてターゲットドメインの性能を向上させる。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。