[論文レビュー] Learning to Generate Novel Domains for Domain Generalization
本稿では、最適輸送に基づく分散最大化を用いて、ソースデータから多様で擬似新規ドメインを合成する条件付き生成モデルを訓練することで、モデルのロバスト性を向上させるドメイン一般化手法L2A-OTを提案する。本手法は、サイクル整合性と分類損失を介して意味を保持しつつドメイン多様性を高めることで一般化性能を向上させ、PACS、Office-Home、Digits-DGを含む4つのベンチマークデータセットにおいて最先端の手法を上回る性能を達成する。
This paper focuses on domain generalization (DG), the task of learning from multiple source domains a model that generalizes well to unseen domains. A main challenge for DG is that the available source domains often exhibit limited diversity, hampering the model's ability to learn to generalize. We therefore employ a data generator to synthesize data from pseudo-novel domains to augment the source domains. This explicitly increases the diversity of available training domains and leads to a more generalizable model. To train the generator, we model the distribution divergence between source and synthesized pseudo-novel domains using optimal transport, and maximize the divergence. To ensure that semantics are preserved in the synthesized data, we further impose cycle-consistency and classification losses on the generator. Our method, L2A-OT (Learning to Augment by Optimal Transport) outperforms current state-of-the-art DG methods on four benchmark datasets.
研究の動機と目的
- 既存のドメイン一般化(DG)手法におけるドメイン多様性の不足が、未観測ドメインへの一般化を妨げるという問題に取り組む。
- 学習済みソースドメインに過学習するリスクを回避するため、合成データを用いて明示的に訓練ドメインの多様性を高める。
- ターゲットドメインデータを必要とせずに、意味的に整合性のある、分布的に異なる擬似新規ドメインを生成する生成モデルを開発する。
- サイクル整合性と分類損失を通じて、生成画像の意味的および構造的正確性を保証する。
提案手法
- ソースドメインの画像を、ソース分布から最大の最適輸送(OT)距離をとるように、擬似新規ドメインにマッピングする条件付き生成ネットワークを訓練する。
- 生成器の目的関数は、ソースドメインと生成ドメイン間のOTに基づくドメイン分散を最大化することで、分布的 nouveauté(新規性)を保証する。
- ドメインマッピングのサイクルを通じて、ドメイン間の翻訳において構造的一致性を維持するため、サイクル整合性損失を適用する。
- 生成画像に分類損失を適用することで、意味的正確性を維持し、同じクラスとして識別可能であることを保証する。
- OT分散、サイクル整合性、分類項を組み合わせた複合損失を用いて、生成器をエンドツーエンドで訓練する。
- 最終的なモデルは、実際のソースドメインと合成された擬似新規ドメインの組み合わせを用いて訓練され、一般化性能の向上を図る。
実験結果
リサーチクエスチョン
- RQ1ソースデータから擬似新規ドメインを合成することで、ドメイン一般化タスクにおける一般化性能が向上するか?
- RQ2ソースドメインと生成ドメイン間の最適輸送に基づくドメイン分散を最大化することで、ドメインアライメントよりも優れた一般化が達成できるか?
- RQ3サイクル整合性と分類損失の導入が、DGにおける生成画像の品質と実用性に与える影響は何か?
- RQ4生成ドメインの数やソースドメインの選択に依存しない性能の安定性は保証されるか?
- RQ5生成ドメインは、実際のソースドメインおよび互いに、分布および特徴空間でどのように比較されるか?
主な発見
- L2A-OTは、PACS、Office-Home、Digits-DG、およびクロスドメインの人物再識別を含む4つのベンチマークデータセットで最先端の性能を達成した。
- 3つのソースドメインを有するDigits-DGでは、L2A-OTが62.5%の精度を達成し、アンサンブルベースライン(57.1%)および他の最先端手法を上回った。
- 生成ドメインの数に強く依存せず、$K_n = K_s$のとき性能が安定しており、$K_n = K_s$が強力なデフォルト選択肢であることが示された。
- t-SNE可視化により、生成ドメインがソースドメインから明確に分離され、特徴空間に明確なクラスタを形成していることが確認された。
- L2A-OTが生成する画像は、ソースドメインと顕著な分布的差異(例:テクスチャ、色、背景の変更)を示しながらも、意味的コンテンツを保持している。
- CrossGradと比較して、t-SNEおよび視覚的検証により、L2A-OTはより顕著なドメインシフトを生成しており、これがより優れた一般化性能をもたらしていることが確認された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。