[論文レビュー] Virtual Mixup Training for Unsupervised Domain Adaptation
仮想ミックスアップ訓練(VMT)を導入し、未監督ドメイン適応の訓練ポイント間で局所リプシュitzを課し、VADAベースのモデルを6つのベンチマークで改善、特に MNIST から SVHN へ。
We study the problem of unsupervised domain adaptation which aims to adapt models trained on a labeled source domain to a completely unlabeled target domain. Recently, the cluster assumption has been applied to unsupervised domain adaptation and achieved strong performance. One critical factor in successful training of the cluster assumption is to impose the locally-Lipschitz constraint to the model. Existing methods only impose the locally-Lipschitz constraint around the training points while miss the other areas, such as the points in-between training data. In this paper, we address this issue by encouraging the model to behave linearly in-between training points. We propose a new regularization method called Virtual Mixup Training (VMT), which is able to incorporate the locally-Lipschitz constraint to the areas in-between training data. Unlike the traditional mixup model, our method constructs the combination samples without using the label information, allowing it to apply to unsupervised domain adaptation. The proposed method is generic and can be combined with most existing models such as the recent state-of-the-art model called VADA. Extensive experiments demonstrate that VMT significantly improves the performance of VADA on six domain adaptation benchmark datasets. For the challenging task of adapting MNIST to SVHN, VMT can improve the accuracy of VADA by over 30\%. Code is available at \url{https://github.com/xudonmao/VMT}.
研究の動機と目的
- クラスタ仮定をより適切に強制することによって、未監督ドメイン適応を動機づけ、改善する。
- 訓練点のみを対象とする既存の局所リプシュitz正則化手法の限界に対処する。
- データ間領域にもリプシュitz制約を拡張するミックスアップベースの正則化を導入する。
- ミックスアップに仮想ラベルを用いることで未監督ドメイン適応への適用性を可能にする。
- VMT が標準的なドメイン適応ベンチマークで最先端の結果をもたらすことを示す。
提案手法
- 訓練サンプルと仮想ラベルの間で線形変化を強制するために、Virtual Mixup Training (VMT) を提案する。
- ミックスアップの定式化において実ラベルを仮想ラベル(分類器によって予測されたもの)に置換し、未監督ドメイン適応に適するようにする。
- 安定性を向上させるため、確率ではなくロジット(ソフトマックス前の層)上でミックスアップを行う。
- VMT を既存のモデル(特に VADA)と組み合わせ、ソース/ターゲット損失、VAT、条件付きエントロピーを含む結合目的関数とする。
- ベータ分布に従う混合係数を用いてサンプルと仮想ラベルの凸結合を作成し、次に f(tilde{x}) と tilde{y} の間の KL 発散をペナルティ化する。
- VMT の初期化後にターゲットドメインで反復的な改良段階(DIRT-T)を任意で適用し、クラスタ仮定をさらに最適化する。
実験結果
リサーチクエスチョン
- RQ1訓練サンプル間の領域に局所的リプシュitz制約をどのように拡張して、未監督ドメイン適応を実現できるか?
- RQ2仮想ラベルを用いたロジット上のミックスアップは、確率上でのミックスアップと比べて安定性と性能を向上させるか?
- RQ3VMT は複数のドメイン適応ベンチマークで一貫して最先端の VADA を上回ることができるか?
- RQ4VMT を仮想敵対的訓練(VAT)および DIRT-T と組み合わせた場合、ターゲットドメインのクラスタリングと整合性にどのような影響があるか?
主な発見
- VMT は六つの標準的な視覚的ドメイン適応ベンチマークで VADA の性能を向上させる。
- ロジット上のミックスアップは、確率上でのミックスアップより安定性が高く精度も向上し、特に難しい MNIST→SVHN タスクで顕著。
- VMT は複数のタスクで最先端の結果を達成し、ターゲット訓練済み分類器の上限とのギャップを大幅に縮める(例: インスタンス正規化なしの MNIST→SVHN)。
- VMT と DIRT-T の組み合わせにより、多くの設定でターゲットドメインのクラスタリングと整合性がさらに強化される。
- VMT は VAT より計算コストが低く、併用時には相補的な利点を提供する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。