QUICK REVIEW

[论文解读] Domain Generalization via Model-Agnostic Learning of Semantic Features

Qi Dou, Daniel C. Castro|arXiv (Cornell University)|Oct 29, 2019

Domain Adaptation and Few-Shot Learning被引用 428

一句话总结

MASF 采用分段的模型无关训练，结合全局类别对齐和局部基于度量的聚类，学习在未见域上也能泛化的语义特征空间，在 VLCS 和 PACS 上实现了最先进的结果，并在医学影像分割上有所提升。

ABSTRACT

Generalization capability to unseen domains is crucial for machine learning models when deploying to real-world conditions. We investigate the challenging problem of domain generalization, i.e., training a model on multi-domain source data such that it can directly generalize to target domains with unknown statistics. We adopt a model-agnostic learning paradigm with gradient-based meta-train and meta-test procedures to expose the optimization to domain shift. Further, we introduce two complementary losses which explicitly regularize the semantic structure of the feature space. Globally, we align a derived soft confusion matrix to preserve general knowledge about inter-class relationships. Locally, we promote domain-independent class-specific cohesion and separation of sample features with a metric-learning component. The effectiveness of our method is demonstrated with new state-of-the-art results on two common object recognition benchmarks. Our method also shows consistent improvement on a medical image segmentation task.

研究动机与目标

在测试域统计未知且训练期间没有目标数据的情况下，激励域泛化。
学习对跨多个源域有鲁棒性的具有语义意义的特征表示。
提出全局和局部正则化，塑造特征空间——全局对齐类间关系和局部、域无关的类聚类。
利用 episodic 训练的模型无关元学习来提升对未见域的泛化能力。

提出的方法

通过将源域分为 meta-train 和 meta-test 来模拟域转移，采用 episodic 训练。
引入一个全局类别对齐损失，使用对称KL散度使 meta-train 和 meta-test 域的软混淆矩阵一致。
通过度量嵌入网络引入局部样本聚类损失，利用对比或三元组损失鼓励域无关的类别内聚和分离。
用任务损失加元损失更新特征提取器和任务网络；用局部损失更新嵌入网络以强化聚类。
使用类别均值特征向量形成每个类别的软标签，并通过温度控制的 softmax 计算软混淆矩阵，指导跨域语义对齐。
提供两种具体的局部聚类度量学习损失：对比损失（d_phi）和带半难样本挖掘的三元组损失，以实现高效训练。

实验结果

研究问题

RQ1我们如何在多个源域上训练模型，使其在没有目标域数据的训练条件下对未见域具备泛化能力？
RQ2是否通过显式正则化特征空间的语义结构来提升域泛化，而不是仅依赖传统的任务驱动损失？
RQ3将全局的类间关系对齐与局部样本聚类结合，是否在域转移下带来更好的泛化？
RQ4模型无关的 episodic 学习框架在自然图像识别基准和医学影像分割任务上是否都有效？

主要发现

MASF 在 VLCS 上实现了状态至上的平均准确率，目标域从 72.19 提升到 74.11。
在 PACS 上，MASF 相比基线平均准确率提升了 3.51 个百分点，在 Sketch 目标域上显示出显著增益。
消融研究证实全局类别对齐和局部聚类都对性能有贡献，且二者与 episodic 训练结合时达到最佳结果。
深度残差结构（ResNet-18/50）也从 MASF 中受益，展示了对不同网络骨干的鲁棒性。
在医学脑部 MRI 分割中，MASF 相比 DeepAll 提升了 Dice 分数，尤其在迁移到新的临床站点（Set-D）时，且通过轮廓分析显示类内聚集更紧凑。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。