[论文解读] End-to-End Physics Event Classification with the CMS Open Data: Applying Image-based Deep Learning on Detector Data to Directly Classify Collision Events at the LHC
本文提出了一种基于图像的端到端深度学习方法,直接利用CMS开放数据中的低水平模拟探测器数据,对大型强子对撞机(LHC)的质子-质子碰撞事例进行分类。通过学习电磁簇射形状、角度分布和打点能量等特征——即使粒子未被完全解析——该方法在区分Higgs玻色子衰变到两个光子与主要背景过程方面,优于基于运动学的分类器。
This paper describes the construction of novel end-to-end image-based classifiers that directly leverage low-level simulated detector data to discriminate signal and background processes in proton–proton collision events at the Large Hadron Collider at CERN. To better understand what end-to-end classifiers are capable of learning from the data and to address a number of associated challenges, we distinguish the decay of the standard model Higgs boson into two photons from its leading background sources using high-fidelity simulated CMS Open Data. We demonstrate the ability of end-to-end classifiers to learn from the angular distribution of the photons recorded as electromagnetic showers, their intrinsic shapes, and the energy of their constituent hits, even when the underlying particles are not fully resolved, delivering a clear advantage in such cases over purely kinematics-based classifiers.
研究动机与目标
- 开发一种端到端分类器,直接使用LHC的低水平探测器数据进行事例分类。
- 探究深度学习模型是否能从原始探测器数据中学习到有意义的物理特征,而无需依赖重构的运动学变量。
- 通过利用电磁簇射中的空间和能量模式,提升Higgs玻色子衰变到两个光子时的信号-背景区分能力。
- 评估在粒子身份未被完全解析的场景下,基于图像的分类器的性能。
提出的方法
- 该方法从模拟的CMS探测器数据中构建电磁簇射的二维图像表示,编码粒子打点的空间和能量信息。
- 使用卷积神经网络(CNN)在这些探测器级图像上进行端到端训练,将碰撞事例分类为信号(H→γγ)或背景。
- 该模型从簇射的固有形状、光子的角度分布以及能量沉积模式中进行学习,无需中间重构步骤。
- 该方法使用高保真度的模拟CMS开放数据,以确保训练和评估条件的真实感。
- 通过AUC和信号显著性等标准指标对分类器进行评估,以衡量其性能。
实验结果
研究问题
- RQ1在原始探测器数据上进行训练的端到端深度学习模型,能否有效区分Higgs玻色子衰变到两个光子与主要背景过程?
- RQ2当粒子身份未被完全解析时,这些模型从簇射打点的空间和能量分布中学习到了哪些物理特征?
- RQ3基于图像的分类器使用探测器级数据与传统的基于运动学的分类器相比,性能如何?
- RQ4当重建存在歧义的复杂事例拓扑结构时,该模型的泛化能力达到何种程度?
主要发现
- 端到端的基于图像的分类器成功学习到了探测器中电磁簇射的固有形状和角度分布特征。
- 与基于运动学的分类器相比,该模型性能更优,尤其在粒子身份未被完全解析的情况下表现更佳。
- 该分类器在捕捉簇射打点间细微的能量沉积模式方面表现出稳健性,有助于提升信号与背景的分离能力。
- 该方法表明,深度学习模型能够直接从原始探测器数据中提取出有意义的、与物理相关的特征,而无需显式特征工程。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。