[论文解读] Solving Combinatorial Problems at Particle Colliders Using Machine Learning
本文提出了一种物理启发的机器学习模型 cannonball,通过引入洛伦兹不变层来解决高多重性粒子对撞机事例中的组合问题。通过学习高维动量关联,该模型在重建衰变拓扑结构方面优于经典方法(如不变质量法和角度最小化法),尤其在具有复杂喷射多重性和超过百万百分比组合背景的R-奇偶性破坏型超对称场景中表现优异。
High-multiplicity signatures at particle colliders can arise in Standard Model processes and beyond. With such signatures, difficulties often arise from the large dimensionality of the kinematic space. For final states containing a single type of particle signature, this results in a combinatorial problem that hides underlying kinematic information. We explore using a neural network that includes a Lorentz Layer to extract high-dimensional correlations. We use the case of squark decays in $R$-Parity-violating Supersymmetry as a benchmark, comparing the performance to that of classical methods. With this approach, we demonstrate significant improvement over traditional methods.
研究动机与目标
- 解决高多重性末态中组合背景持续存在的挑战,其中正确的粒子配对因可能组合数量庞大而难以辨识。
- 克服经典方法(如不变质量最小化和角度聚类)在真实探测器分辨率和高喷射多重性下失效的局限性。
- 证明基于物理启发的机器学习架构能够有效提取经典优化技术难以实现的复杂动量关联。
- 为在传统方法因组合复杂度过高而失效的真实世界对撞机事例中应用机器学习奠定基础。
- 提供一种可扩展、可微分的框架,保持物理对称性,避免引入新的系统不确定性,从而在高能物理分析中实现稳健应用。
提出的方法
- 提出一种名为 cannonball 的定制神经网络架构,通过引入洛伦兹层以可微分方式保持相对论不变性,并对四维动量变换进行建模。
- 采用全连接前馈网络结合洛伦兹层,处理N个四维动量,学习从一组喷射中预测正确的衰变产物配对。
- 使用基于正确衰变拓扑结构的监督损失函数,通过R-奇偶性破坏型超对称的蒙特卡洛模拟数据端到端训练模型。
- 集成洛伦兹层以确保网络预测在洛伦兹变换下保持不变,从而在不同事件参考系中维持物理一致性。
- 将性能与经典方法(不变质量不对称性最小化和角度分离最小化(ΔRΣ))进行比较,以信号效率和背景抑制为指标。
- 将模型应用于基准事例,包括(2×2)、(2×4)和(2×5)喷射末态,涵盖逐步增加的组合复杂度以及真实探测器效应(如分辨率和堆叠)。
实验结果
研究问题
- RQ1机器学习模型能否在大型强子对撞机(LHC)的高多重性喷射事例中,优于经典组合重建技术,实现衰变拓扑结构的重建?
- RQ2通过专用洛伦兹层引入洛伦兹不变性,在动量事件解释任务中能在多大程度上提升泛化能力和性能?
- RQ3在存在动量分辨率和堆叠等真实探测器效应的情况下,尤其在组合背景极大(如超过100万种组合)的场景中,模型表现如何?
- RQ4可微分、物理启发的架构能否在不引入新系统不确定性的情况下,用于解释复杂级联衰变(如胶微子 → 夸克 + 中性子 → 三个夸克)?
- RQ5在信号参数事先未知的新物理搜索中,模型是否能在广泛的共振质量与线形参数范围内保持鲁棒性?
主要发现
- 在所有测试的共振质量下,cannonball 模型在(2×2)喷射拓扑结构中显著优于经典方法(特别是不变质量不对称性和角度分离最小化),实现了更高的信号效率和背景抑制能力。
- 在(2×4)和(2×5)喷射拓扑结构中,组合背景分别超过10,000%和126,000%,模型仍保持高性能,展现出经典方法失效时的鲁棒性。
- 引入洛伦兹层使模型能够泛化于不同事件提升状态和动量构型,保持物理不变性,并在泛化能力上优于非洛伦兹不变基线模型。
- 在1 TeV共振质量下,(2×2)情形中模型的信号效率超过90%,即使在真实探测器分辨率下仍优于最佳经典方法超过20个百分点。
- 模型在广泛共振质量与线形参数范围内的性能保持稳定,表明其适用于信号参数未知的广谱新物理搜索。
- 该方法避免引入新的系统不确定性,因其可作为经典组合重建的即插即用替代方案,与标准分析流程保持兼容。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。