Skip to main content
QUICK REVIEW

[论文解读] Jet Constituents for Deep Neural Network Based Top Quark Tagging

J. Pearkes|arXiv (Cornell University)|Apr 7, 2017
Particle physics theoretical and experimental studies参考文献 21被引用 34
一句话总结

该论文提出一种深度神经网络(DNN)方法用于顶夸克喷注标签,通过将喷注成分的有序序列作为输入,完整保留喷注的全部信息,避免像素化或高层次特征提取。该方法在横动量为600–2500 GeV的重建级喷注中,实现了50%信号效率下的45倍背景抑制,且在LHC运行2期间预期的堆叠水平下仍保持鲁棒性。

ABSTRACT

Recent literature on deep neural networks for tagging of highly energetic jets resulting from top quark decays has focused on image based techniques or multivariate approaches using high-level jet substructure variables. Here, a sequential approach to this task is taken by using an ordered sequence of jet constituents as training inputs. Unlike the majority of previous approaches, this strategy does not result in a loss of information during pixelisation or the calculation of high level features. The jet classification method achieves a background rejection of 45 at a 50% efficiency operating point for reconstruction level jets with transverse momentum range of 600 to 2500 GeV and is insensitive to multiple proton-proton interactions at the levels expected throughout Run 2 of the LHC.

研究动机与目标

  • 开发一种顶夸克喷注标签方法,通过使用原始喷注成分序列,避免因像素化或高层次特征提取导致的信息损失。
  • 提升横动量范围为600–2500 GeV的高能喷注中顶夸克喷注标签的背景抑制能力。
  • 评估在LHC运行2水平堆叠效应下的鲁棒性。
  • 探究DNN是否能在不依赖显式高层次变量的情况下,学习到有意义的喷注子结构特征。
  • 探索基于序列的深度学习架构在高能物理喷注标签中的潜力。

提出的方法

  • 该模型将喷注成分的四维动量有序序列作为输入,完整保留喷注的全部运动学信息。
  • 使用全连接前馈DNN对序列化喷注成分数据进行训练,输入顺序与预处理设计旨在保持物理喷注特性。
  • 网络通过二元交叉熵损失函数进行训练,以将喷注分类为顶夸克衰变(信号)或QCD喷注(背景)。
  • 数据预处理包括成分的归一化及基于横动量的排序,以增强模型泛化能力。
  • 架构在多种深度与宽度配置下进行评估,包括渐变收缩和Dropout正则化变体。
  • 在不同堆叠场景与喷注增强条件下测试该方法,以评估其鲁棒性。

实验结果

研究问题

  • RQ1使用原始喷注成分的序列化DNN方法是否能在顶夸克喷注标签中超越传统的图像基或多变量子结构技术?
  • RQ2与高层次特征相比,完整保留成分级信息在多大程度上提升了背景抑制能力?
  • RQ3DNN在LHC运行2水平堆叠效应下的性能有多鲁棒?
  • RQ4DNN是否在未显式训练的情况下,隐式学习到已知的子结构变量(如喷注质量与τ32)?
  • RQ5如LSTM等替代架构是否能进一步提升基于序列的喷注标签性能?

主要发现

  • 在横动量范围为600–2500 GeV的重建级喷注中,DNN在50%信号效率操作点实现了45倍的背景抑制因子。
  • 对于真实粒子级喷注,相同50%效率点下的背景抑制达到65,表明其在部分子级信息上表现强劲。
  • 在LHC 2016堆叠场景下,模型性能无显著下降,证明其对多重质子-质子相互作用具有鲁棒性。
  • 网络输出与喷注质量强相关,与τ32中等相关,表明其在无显式监督下已学会识别关键子结构特征。
  • 网络输出与喷注横动量无相关性,证实模型分类不依赖于pT。
  • 架构变体(包括更深网络、渐变收缩结构与Dropout正则化)未提升性能,表明当前默认架构在此设置下已接近最优。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。