[论文解读] Using Machine Learning to disentangle LHC signatures of Dark Matter candidates
本论文提出一种机器学习框架,利用单喷流和二喷流事件中的缺失横向能量(MET),对暗物质(DM)候选者——具体为超对称(SUSY)中的WIMP、轴子样粒子(ALP)以及具有重媒介子的轻量DM——的强子对撞机信号进行解耦。该研究对比了传统运动学特征与事件分布的二维图像表示,结果表明,将卷积神经网络(CNN)应用于这些图像可显著提升分类性能,尤其在组合复杂终态中优于传统方法。
We study the prospects of characterising Dark Matter at colliders using Machine Learning (ML) techniques. We focus on the monojet and missing transverse energy (MET) channel and propose a set of benchmark models for the study: a typical WIMP Dark Matter candidate in the form of a SUSY neutralino, a pseudo-Goldstone impostor in the shape of an Axion-Like Particle, and a light Dark Matter impostor whose interactions are mediated by a heavy particle. All these benchmarks are tensioned against each other, and against the main SM background ($Z$+jets). Our analysis uses both the leading-order kinematic features as well as the information of an additional hard jet. We explore different representations of the data, from a simple event data sample with values of kinematic variables fed into a Logistic Regression algorithm or a Fully Connected Neural Network, to a transformation of the data into images related to probability distributions, fed to Deep and Convolutional Neural Networks. We also study the robustness of our method against including detector effects, dropping kinematic variables, or changing the number of events per image. In the case of signals with more combinatorial possibilities (events with more than one hard jet), the most crucial data features are selected by performing a Principal Component Analysis. We compare the performance of all these methods, and find that using the 2D images of the combined information of multiple events significantly improves the discrimination performance.
研究动机与目标
- 为解决在LHC单喷流与二喷流搜索中,多种暗物质候选者与背景态之间存在退相干问题,传统方法难以区分的挑战。
- 评估机器学习技术在仅基于微分运动学特征、不依赖产生截面的前提下,对暗物质信号表征的有效性。
- 比较不同机器学习模型(逻辑回归、全连接网络与深度CNN)在三种数据表示形式下的性能:原始运动学变量与2D事件分布直方图。
- 在真实模拟条件下,评估方法对探测器效应、缺失运动学变量及不同信号-背景比的鲁棒性。
- 确定多事件运动学信息的图像表示是否能超越单事件特征,提升分类能力。
提出的方法
- 基准模型包括100 GeV的SUSY中性子(WIMP)、300 GeV的ALP,以及一个具有自旋-1媒介子的简化模型,全部与SM Z+jets背景进行对比。
- 运动学特征包括喷流横向动量、伪快度、空间夹角与MET,二喷流事件中额外包含硬喷流信息。
- 数据以三种形式表示:(1) 原始运动学变量输入逻辑回归与全连接神经网络;(2) 2D运动学分布直方图输入深度神经网络(DNN);(3) 相同直方图经卷积神经网络(CNN)处理。
- 对具有高组合复杂度的二喷流事件,应用主成分分析(PCA)以降低维度并识别关键特征。
- 模拟在部分子级(LO)与探测器级(NLO)均进行,包含真实探测器效应,以检验鲁棒性。
- 性能通过AUC(ROC曲线下面积)评估,比较不同信号类型、数据表示形式与信号-背景比。
实验结果
研究问题
- RQ1当WIMP、ALP与轻量DM在单喷流与二喷流事件中具有相似末态特征时,机器学习技术能否有效解耦这些不同的暗物质候选者?
- RQ2将运动学数据表示为原始变量、2D直方图或类图像分布,如何影响机器学习分类器的判别能力?
- RQ3在多事件运动学分布的2D图像表示上训练的CNN,相较于基于原始运动学特征的传统机器学习模型,性能提升程度如何?
- RQ4这些机器学习方法对真实探测器效应、缺失运动学变量及低信号-背景比的鲁棒性如何?
- RQ5不同运动学变量在区分DM模型中的相对重要性如何?PCA是否有助于识别最具信息量的特征?
主要发现
- 使用组合运动学信息的2D图像表示——特别是输入卷积神经网络(CNN)时——可显著提升信号判别能力,优于基于原始运动学变量的传统方法。
- 在单喷流通道中,表现最佳的模型(DNN处理2D直方图)对EFT基准模型的AUC达到0.72,对SUSY2的AUC为0.70,显示出强大的判别能力。
- 在二喷流通道中,CNN处理2D直方图在区分SUSY WIMP与ALP及EFT模型方面表现更优,尤其在较高DM质量区域。
- ALP信号最难与SM背景区分,探测器级AUC仅约0.57,凸显其与SM过程的高度相似性。
- 当信号-背景比偏低(NSig ≪ NBG)时性能下降,表明该方法更适合发现后的表征分析,而非发现本身。
- PCA分析表明,最具信息量的特征通常为MET、喷流夹角与缺失横向动量的组合,PC-1与PC-2已捕捉到背景与信号分布中的大部分方差。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。