QUICK REVIEW

[论文解读] Adversarial domain adaptation to reduce sample bias of a high energy physics classifier

Jose M. Clavijo, P. C. F. Glaysher|arXiv (Cornell University)|Jan 1, 2020

Domain Adaptation and Few-Shot Learning参考文献 6被引用 4

一句话总结

本文提出一种带有梯度反转层的领域对抗神经网络（DANN），以减少高能物理事件分类中的样本偏差，特别针对大型强子对撞机（LHC）中罕见的$t\bar{t}H$（H→bb）信号。通过联合训练共享特征提取器以区分信号与背景，同时对抗性地最小化两种蒙特卡罗背景模型之间的领域差异，该方法降低了因背景模拟选择导致的模型偏差，将信号纯度不确定性从50%信号效率下的47%降至0.3%。

ABSTRACT

We apply adversarial domain adaptation to reduce sample bias in a classification machine learning algorithm. We add a gradient reversal layer to a neural network to simultaneously classify signal versus background events, while minimising the difference of the classifier response to a background sample using an alternative MC model. We show this on the example of simulated events at the LHC with $t\bar{t}H$ signal versus $t\bar{t}b\bar{b}$ background classification.

研究动机与目标

解决高能物理分类器因依赖特定蒙特卡罗（MC）背景模拟而引入的显著偏差问题。
降低在使用一种MC背景模型训练的模型应用于不同真实世界或替代MC背景模型时导致的分类器性能下降。
开发一种领域自适应方法，在最小化对源背景模型依赖的同时保持分类能力。
通过避免依赖带标签的目标数据，实现对真实碰撞数据的无监督适应。
研究在复杂、高维物理数据中对抗性领域自适应的超参数敏感性与训练稳定性。

提出的方法

使用具有共享特征提取器和两个独立分支的深度神经网络：一个用于信号/背景分类，另一个用于领域分类（背景模型）。
在特征提取器与领域分类器之间引入梯度反转层，反向传播梯度以鼓励学习领域不变表示。
在来自两个不同MC背景模型（源领域）的带标签信号/背景事件上以监督方式训练网络，同时通过对抗性损失最小化领域分类器的准确率。
使用不依赖带标签目标数据的程序优化超参数，包括梯度反转权重$\lambda$。
对领域分类器使用线性激活函数和损失函数，以提高训练稳定性和收敛性。
使用物理相关指标（如信号纯度、中位显著性、ROC曲线下面积）在不同信号效率下评估性能。

实验结果

研究问题

RQ1对抗性领域自适应能否有效减少高能物理中因MC背景模型差异导致的分类器偏差？
RQ2超参数选择，特别是梯度反转权重$\lambda$，如何影响分类性能与领域不变性之间的权衡？
RQ3在缺乏带标签目标数据的情况下，该方法在实现领域不变性的同时，能在多大程度上保持分类能力？
RQ4梯度反转层引入了哪些关键训练稳定性问题，以及如何缓解？
RQ5该方法能否扩展以处理源域与目标域之间的标签分布偏移，例如信号与背景比例不同？

主要发现

该方法成功将因背景模型选择导致的信号纯度不确定性从50%信号效率下的47%降至0.3%，显著提升了分析灵敏度。
采用领域自适应训练的分类器在目标领域上表现出对训练时所用背景模型的高度独立性，同时保持了对目标域的高分类能力。
与非线性替代方案相比，对领域分类器使用线性激活函数和损失函数显著提升了训练稳定性和收敛性。
梯度反转层引入了训练不稳定性，通过仔细的超参数调优以及在领域头中使用线性组件得以缓解。
若真实数据中无法准确估计信号与背景比例，由于标签分布偏移，可能产生微小的残余分类偏差，凸显了该方法在真实世界部署中的关键局限性。
当前方法依赖于真实数据中准确的信号与背景比例估计以实现无监督自适应；未来工作可通过增加额外的对抗分支，从领域分类器中移除标签信息，以应对标签偏移问题。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。