[論文レビュー] Unsupervised Domain Adaptation via Structurally Regularized Deep Clustering
本稿では、教師ありドメインのラベルを構造的正則化として用い、深層クラスタリングを通じて直接的にターゲットデータの内在的識別性を解き明かす、構造的正則化付き深層クラスタリング(SRDC)と呼ばれる新しい教師なしドメイン適応(UDA)手法を提案する。明示的なドメインアライメントを伴わず、予測ラベル分布とソース正則化ラベル分布のKLダイバージェンスを最小化するネットワークの共同学習に加え、中間特徴のクラスタリングと、より発散が小さいとされるソースサンプルのソフト選択により、識別性を向上させることで、3つのUDAベンチマークで最先端の性能を達成する。
Unsupervised domain adaptation (UDA) is to make predictions for unlabeled data on a target domain, given labeled data on a source domain whose distribution shifts from the target one. Mainstream UDA methods learn aligned features between the two domains, such that a classifier trained on the source features can be readily applied to the target ones. However, such a transferring strategy has a potential risk of damaging the intrinsic discrimination of target data. To alleviate this risk, we are motivated by the assumption of structural domain similarity, and propose to directly uncover the intrinsic target discrimination via discriminative clustering of target data. We constrain the clustering solutions using structural source regularization that hinges on our assumed structural domain similarity. Technically, we use a flexible framework of deep network based discriminative clustering that minimizes the KL divergence between predictive label distribution of the network and an introduced auxiliary one; replacing the auxiliary distribution with that formed by ground-truth labels of source data implements the structural source regularization via a simple strategy of joint network training. We term our proposed method as Structurally Regularized Deep Clustering (SRDC), where we also enhance target discrimination with clustering of intermediate network features, and enhance structural regularization with soft selection of less divergent source examples. Careful ablation studies show the efficacy of our proposed SRDC. Notably, with no explicit domain alignment, SRDC outperforms all existing methods on three UDA benchmarks.
研究の動機と目的
- 明示的なドメインアライメントに依存する従来の教師なしドメイン適応(UDA)手法が、内在的データ識別性を損なうリスクに対処すること。
- ソースドメインとターゲットドメインの構造的類似性を仮定したもとで、識別的クラスタリングを用いてターゲットデータの内在的構造を直接解き明かせるかを検討すること。
- 特徴レベルのアライメントを要件とせず、ソースドメインのラベルを構造的正則化として用いてターゲットクラスタリングをガイドする手法を開発すること。
- 中間層のネットワーク特徴のクラスタリングによりターゲットの識別性を向上させるとともに、発散が小さいとされるソース例のソフト選択により正則化を強化すること。
- 明示的なドメインアライメントを伴わず、クラスタリングに基づくアプローチがアライメントに基づく最先端手法を上回ることを実証すること。
提案手法
- SRDCは、ネットワークの予測ラベル分布と補助分布のKLダイバージェンスを最小化する柔軟な深層クラスタリングフレームワークを用いる。
- 構造的ソース正則化は、補助分布をソースドメインの真のラベル分布に置き換えることで実装され、ソースおよびターゲットデータの共同学習を可能にする。
- 中間層特徴のクラスタリングによりターゲットの識別性が向上し、より判別性の高い表現が捉えられる。
- 特徴類似度に基づいて、ターゲットドメインから発散が小さいとされるソース例をソフト選択することで、構造的正則化がさらに強化される。
- クラスタリングと分類の目的関数を共同最適化することで、明示的なドメインアライメントを回避しつつ、内在的データ構造を保持する。
- 単一のネットワークを用いてエンドツーエンドに訓練され、コア最適化目的関数としてKLダイバージェンスの最小化が用いられる。
実験結果
リサーチクエスチョン
- RQ1明示的なドメインアライメントを伴わず、深層クラスタリングを用いてターゲットデータの内在的識別性を効果的に解き明かせるか?
- RQ2ソースドメインのラベルを構造的正則化として用いることで、教師なしドメイン適応におけるターゲットクラスタリング性能が向上するか?
- RQ3発散が小さいとされるソース例のソフト選択は、構造的正則化のロバスト性と精度にどのように影響するか?
- RQ4最終層特徴のクラスタリングのみと比較して、中間層特徴のクラスタリングはターゲットドメインにおける識別性を向上させられるか?
- RQ5クラスタリングに基づくUDAアプローチは、精度および一般化性能の観点で、アライメントに基づく最先端手法を上回るか?
主な発見
- SRDCはOffice-31ベンチマークで最先端の性能を達成し、平均正解率90.8%を記録した。
- ImageCLEF-DAでは90.9%の平均正解率を達成し、前回のSOTA手法(SymNets)を2.0ポイント上回った。
- Office-Homeでは71.3%の平均正解率を達成し、前回のSOTA(MDDで68.1%)を3.2ポイント上回った。
- アブレーションスタディにより、中間特徴のクラスタリングとソース例のソフト選択の両方が、性能向上に顕著な寄与をしていることが確認された。
- SRDCは明示的なドメインアライメントを一切用いず、内在的データ構造を有効に活用できることを示した。
- Office-31におけるすべてのドメイン転送設定(例:A→W、D→W、W→D)で一貫した改善が見られ、優れた一般化能力を示した。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。