Skip to main content
QUICK REVIEW

[论文解读] Particle Transformer for Jet Tagging

H. Qu, C. Li|arXiv (Cornell University)|Feb 8, 2022
Astrophysics and Cosmic Phenomena被引用 45
一句话总结

本论文介绍 JetClass,一个大型喷射标记数据集,以及 ParT,一种基于 Transformer 的模型,具备成对交互感知的注意力,优于现有方法在 JetClass 上的表现,并在微调后提升基准。

ABSTRACT

Jet tagging is a critical yet challenging classification task in particle physics. While deep learning has transformed jet tagging and significantly improved performance, the lack of a large-scale public dataset impedes further enhancement. In this work, we present JetClass, a new comprehensive dataset for jet tagging. The JetClass dataset consists of 100 M jets, about two orders of magnitude larger than existing public datasets. A total of 10 types of jets are simulated, including several types unexplored for tagging so far. Based on the large dataset, we propose a new Transformer-based architecture for jet tagging, called Particle Transformer (ParT). By incorporating pairwise particle interactions in the attention mechanism, ParT achieves higher tagging performance than a plain Transformer and surpasses the previous state-of-the-art, ParticleNet, by a large margin. The pre-trained ParT models, once fine-tuned, also substantially enhance the performance on two widely adopted jet tagging benchmarks. The dataset, code and models are publicly available at https://github.com/jet-universe/particle_transformer.

研究动机与目标

  • 动机:需要一个大规模公开喷射标记数据集,以推动对撞机物理中的深度学习方法的发展。
  • 提出一种基于 Transformer 的架构(ParT),在注意力中纳入成对粒子相互作用,以提高标记性能。
  • 提供对 JetClass 的全面评估,并通过微调在既有喷射标记基准上展示迁移收益。

提出的方法

  • 以 1 亿喷射覆盖 10 种喷射类型定义 JetClass,其中包括此前未探索的类别。
  • 引入 ParT,一种 Transformer 变体,使用两组输入:每粒子特征和每对相互作用特征。
  • 用一个成对交互偏置 U 添加到 softmax 之前的注意力权重中,增强粒子自注意力(P-MHA)。
  • 实现类注意力机制,以生成用于最终分类的全局喷射表示。
  • 对来自粒子四维向量的成对交互特征进行编码,通过 8 维交互嵌入进行变换。
  • 端到端训练 ParT,并与 PFN、P-CNN、ParticleNet 进行比较;同时评估在其他数据集上进行预训练再微调的效果。

实验结果

研究问题

  • RQ1基于 Transformer 的架构结合成对粒子相互作用信息,是否在大规模喷射数据集上超过以往的喷射标记模型?
  • RQ2注意力中的成对交互偏置(P-MHA)对总体性能的贡献是什么?
  • RQ3在 JetClass 上对 ParT 进行预训练,是否通过微调提升在已有喷射标记基准上的表现?

主要发现

  • ParT 在 JetClass 上的准确率和 AUC 均高于 ParticleNet 等基线。
  • 通过 P-MHA 将成对粒子相互作用引入,较普通 Transformer 有显著提升。
  • 在 JetClass 上预训练并在其他喷射标记基准上微调时,ParT 提供了显著改进。
  • 在多种信号类型下,ParT 相对于 ParticleNet 显著提升背景拒绝,某些喷射类型甚至有巨大增益。
  • 消融研究表明用标准 MHA 替换 P-MHA 会降低准确率和背景拒绝,证实成对交互建模的价值。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。