[论文解读] Domain Generalization via Conditional Invariant Representation
本文提出条件不变域泛化(CIDG),一种通过学习跨域不变的类别条件分布 𝕡(h(X)|Y) 的特征表示方法,实现当输入分布和条件标签分布同时发生偏移时的鲁棒泛化。实验表明,CIDG 在合成数据集和真实世界数据集上均优于现有方法,尤其在非独立同分布(non-i.i.d.)数据偏移场景下表现更优,此时先前假设 𝕡(Y|X) 稳定的条件不成立。
Domain generalization aims to apply knowledge gained from multiple labeled source domains to unseen target domains. The main difficulty comes from the dataset bias: training data and test data have different distributions, and the training set contains heterogeneous samples from different distributions. Let $X$ denote the features, and $Y$ be the class labels. Existing domain generalization methods address the dataset bias problem by learning a domain-invariant representation $h(X)$ that has the same marginal distribution $\mathbb{P}(h(X))$ across multiple source domains. The functional relationship encoded in $\mathbb{P}(Y|X)$ is usually assumed to be stable across domains such that $\mathbb{P}(Y|h(X))$ is also invariant. However, it is unclear whether this assumption holds in practical problems. In this paper, we consider the general situation where both $\mathbb{P}(X)$ and $\mathbb{P}(Y|X)$ can change across all domains. We propose to learn a feature representation which has domain-invariant class conditional distributions $\mathbb{P}(h(X)|Y)$. With the conditional invariant representation, the invariance of the joint distribution $\mathbb{P}(h(X),Y)$ can be guaranteed if the class prior $\mathbb{P}(Y)$ does not change across training and test domains. Extensive experiments on both synthetic and real data demonstrate the effectiveness of the proposed method.
研究动机与目标
- 解决当 𝕡(X) 和 𝕡(Y|X) 在不同域之间发生变化时的域泛化问题,挑战了 𝕡(Y|X) 稳定的常见假设。
- 开发一种方法,通过学习具有不变 𝕡(h(X)|Y) 的表示来确保联合分布 𝕡(h(X),Y) 的不变性。
- 消除对 𝕡(Y|X) 在不同域之间保持稳定的假设依赖,该假设在真实世界因果结构(如 Y→X)中常不成立。
- 通过显式正则化类别条件分布的不变性,提升在未见目标域上的泛化性能。
提出的方法
- 提出一种表示学习框架,通过最小化源域之间类别条件分布 𝕡(h(X)|Y) 的方差来实现。
- 引入基于类别先验归一化边缘分布 𝕡_N(h(X)) 方差的正则化项,以减少全局分布差异。
- 通过类别先验的归一化,减轻 𝕡(Y) 在不同域之间发生偏移的影响。
- 引入受核费雪判别分析启发的类内与类间距离约束,以保持判别能力。
- 所有实验均采用 RBF 核方法计算核矩阵,最终分类使用 KNN。
- 通过结合分布不变性与判别学习的目标函数优化,平衡鲁棒性与准确性。
实验结果
研究问题
- RQ1当输入分布 𝕡(X) 和条件标签分布 𝕡(Y|X) 在不同域之间均发生偏移时,能否提升域泛化性能?
- RQ2强制类别条件分布 𝕡(h(X)|Y) 的不变性是否能带来比仅强制边缘分布不变性 𝕡(h(X)) 更好的泛化效果?
- RQ3在 𝕡(Y|X) 不稳定的现实分布偏移场景下,所提方法相较于现有域泛化方法表现如何?
- RQ4类别先验偏移对域泛化模型性能有何影响?如何有效缓解这一影响?
主要发现
- 在合成数据上,CIDG 达到 86.67% 的准确率,显著优于 KPCA、DICA 和 SCA,后三者表现出聚类效果差或类别表示混杂的问题。
- 在 VLCS 数据集上,CIDG 在 10 项域泛化任务中的 9 项上表现最佳,证明其在多样化图像域中的鲁棒性。
- 在 Office+Caltech 数据集上,CIDG 在 10 项任务中的 9 项上取得最优结果,验证了其在复杂真实世界分布偏移下的优越性。
- 当类别条件分布发生偏移时,KPCA 和 DICA 等方法泛化能力差,凸显了仅依赖边缘不变性的局限性。
- 即使在源域与目标域之间类别先验分布 𝕡(Y) 保持不变的情况下(如理论框架所假设),该方法仍保持强大性能。
- 正则化项中引入类别先验归一化,有效降低了类别先验偏移对域分布的影响,提升了泛化稳定性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。